期刊文献+
共找到105篇文章
< 1 2 6 >
每页显示 20 50 100
Predictive modeling for postoperative delirium in elderly patients with abdominal malignancies using synthetic minority oversampling technique 被引量:3
1
作者 Wen-Jing Hu Gang Bai +6 位作者 Yan Wang Dong-Mei Hong Jin-Hua Jiang Jia-Xun Li Yin Hua Xin-Yu Wang Ying Chen 《World Journal of Gastrointestinal Oncology》 SCIE 2024年第4期1227-1235,共9页
BACKGROUND Postoperative delirium,particularly prevalent in elderly patients after abdominal cancer surgery,presents significant challenges in clinical management.AIM To develop a synthetic minority oversampling techn... BACKGROUND Postoperative delirium,particularly prevalent in elderly patients after abdominal cancer surgery,presents significant challenges in clinical management.AIM To develop a synthetic minority oversampling technique(SMOTE)-based model for predicting postoperative delirium in elderly abdominal cancer patients.METHODS In this retrospective cohort study,we analyzed data from 611 elderly patients who underwent abdominal malignant tumor surgery at our hospital between September 2020 and October 2022.The incidence of postoperative delirium was recorded for 7 d post-surgery.Patients were divided into delirium and non-delirium groups based on the occurrence of postoperative delirium or not.A multivariate logistic regression model was used to identify risk factors and develop a predictive model for postoperative delirium.The SMOTE technique was applied to enhance the model by oversampling the delirium cases.The model’s predictive accuracy was then validated.RESULTS In our study involving 611 elderly patients with abdominal malignant tumors,multivariate logistic regression analysis identified significant risk factors for postoperative delirium.These included the Charlson comorbidity index,American Society of Anesthesiologists classification,history of cerebrovascular disease,surgical duration,perioperative blood transfusion,and postoperative pain score.The incidence rate of postoperative delirium in our study was 22.91%.The original predictive model(P1)exhibited an area under the receiver operating characteristic curve of 0.862.In comparison,the SMOTE-based logistic early warning model(P2),which utilized the SMOTE oversampling algorithm,showed a slightly lower but comparable area under the curve of 0.856,suggesting no significant difference in performance between the two predictive approaches.CONCLUSION This study confirms that the SMOTE-enhanced predictive model for postoperative delirium in elderly abdominal tumor patients shows performance equivalent to that of traditional methods,effectively addressing data imbalance. 展开更多
关键词 Elderly patients Abdominal cancer Postoperative delirium synthetic minority oversampling technique Predictive modeling Surgical outcomes
在线阅读 下载PDF
Modelling Key Population Attrition in the HIV and AIDS Programme in Kenya Using Random Survival Forests with Synthetic Minority Oversampling Technique-Nominal Continuous
2
作者 Evan Kahacho Charity Wamwea +1 位作者 Bonface Malenje Gordon Aomo 《Journal of Data Analysis and Information Processing》 2023年第1期11-36,共26页
HIV and AIDS has continued to be a major public health concern, and hence one of the epidemics that the world resolved to end by 2030 as highlighted in sustainable development goals (SDGs). A colossal amount of effort... HIV and AIDS has continued to be a major public health concern, and hence one of the epidemics that the world resolved to end by 2030 as highlighted in sustainable development goals (SDGs). A colossal amount of effort has been taken to reduce new HIV infections, but there are still a significant number of new infections reported. HIV prevalence is more skewed towards the key population who include female sex workers (FSW), men who have sex with men (MSM), and people who inject drugs (PWID). The study design was retrospective and focused on key population enrolled in a comprehensive HIV and AIDS programme by the Kenya Red Cross Society from July 2019 to June 2021. Individuals who were either lost to follow up, defaulted (dropped out, transferred out, or relocated) or died were classified as attrition;while those who were active and alive by the end of the study were classified as retention. The study used density analysis to determine the spatial differences of key population attrition in the 19 targeted counties, and used Kilifi county as an example to map attrition cases in smaller administrative areas (sub-county level). The study used synthetic minority oversampling technique-nominal continuous (SMOTE-NC) to balance the datasets since the cases of attrition were much less than retention. The random survival forests model was then fitted to the balanced dataset. The model correctly identified attrition cases using the predicted ensemble mortality and their survival time using the estimated Kaplan-Meier survival function. The predictive performance of the model was strong and way better than random chance with concordance indices greater than 0.75. 展开更多
关键词 Random Survival Forests synthetic minority oversampling technique-Nominal Continuous (smote-NC) Key Population Female Sex Workers (FSW) Men Who Have Sex with Men (MSM) People Who Inject Drugs (PWID)
在线阅读 下载PDF
基于SMOTE算法的腹膜透析患者合并重度贫血的预测模型构建
3
作者 燕雯雯 储杨敏 +1 位作者 束永兵 罗寅亮 《皖南医学院学报》 2025年第1期29-32,37,共5页
目的:探讨腹膜透析患者合并重度贫血的危险因素,并基于少数类样本合成过抽样技术(SMOTE)算法构建腹膜透析患者合并重度贫血的预测模型。方法:选取2020年1月~2022年10月六安市中医院诊治的212例腹膜透析患者作为研究对象。采用多因素Logi... 目的:探讨腹膜透析患者合并重度贫血的危险因素,并基于少数类样本合成过抽样技术(SMOTE)算法构建腹膜透析患者合并重度贫血的预测模型。方法:选取2020年1月~2022年10月六安市中医院诊治的212例腹膜透析患者作为研究对象。采用多因素Logistic回归分析筛选腹膜透析患者合并重度贫血的危险因素,应用SMOTE算法构建腹膜透析患者合并重度贫血的预测模型,并对其预测效能进行分析。结果:212例腹膜透析患者中有72例患者发生重度贫血,重度贫血的发生率为33.96%(72/212)。Logistic回归分析结果显示,血清铁降低、营养不良、未使用补血药物及C-反应蛋白(C-reactive protein,CRP)水平升高等是腹膜透析患者合并重度贫血的危险因素,铁蛋白升高、转铁蛋白升高是腹膜透析患者合并重度贫血的保护因素(P<0.05)。基于SMOTE算法的预警模型Logit(P)=1.266血钙+1.702血清铁+1.578营养不良+1.815未使用补血药物-0.115铁蛋白-2.687转铁蛋白+0.511CRP+12.199,H-L检验结果(决定系数R 2=0.187,P=0.924)提示基于SMOTE算法的预警模型拟合度良好。Logistic回归模型的ROC曲线下面积(AUC)为0.902(95%CI:0.860~0.945),基于SMOTE算法的预测模型的AUC为0.936(95%CI:0.911~0.962),基于SMOTE算法的预测模型的ROC曲线下面积高于Logistic回归模型(P<0.05)。结论:血清铁降低、营养不良、未使用补血药物及CRP等是腹膜透析患者合并重度贫血的危险因素,铁蛋白升高、转铁蛋白升高是腹膜透析患者合并重度贫血的保护因素,基于SMOTE算法的预警模型对腹膜透析患者合并重度贫血预测的准确性较高。 展开更多
关键词 腹膜透析 重度贫血 危险因素 少数类样本合成过抽样技术
在线阅读 下载PDF
基于SMOTE-IKPCA-SeNet深度迁移学习的小批量生产质量预测研究 被引量:1
4
作者 杨剑锋 崔少红 +1 位作者 段家琦 王宁 《工业工程》 2024年第2期98-106,157,共10页
随着智能制造技术的发展和客户个性化需求的增加,多品种小批量生产方式逐渐成为制造业的主流。面向大批量生产、以统计过程控制为核心的质量管理方式并不适用于小批量生产。针对复杂生产过程存在参数多、非线性和交互作用的问题,提出利... 随着智能制造技术的发展和客户个性化需求的增加,多品种小批量生产方式逐渐成为制造业的主流。面向大批量生产、以统计过程控制为核心的质量管理方式并不适用于小批量生产。针对复杂生产过程存在参数多、非线性和交互作用的问题,提出利用深度迁移学习的方式将历史生产数据作为源域迁移至小样本目标产品数据进行质量预测。首先,通过合成少数类过采样技术(synthetic minority over-sampling technique,SMOTE)和改进的核主成分分析(improved kernel principal component analysis,IKPCA)算法筛选源域和目标域的可迁移特征,这不仅兼顾了特征重要性和可迁移性,还减少了“负迁移”,提高了模型泛化能力;然后,采用结合通道注意力机制的卷积神经网络SeNet构建基于深度迁移学习的质量预测模型。仿真结果表明,随着目标域样本的增加,所提方法的预测准确性明显优于广泛采用的支持向量机建模方法。同时,所提可迁移特征筛选方法显著提高了深度迁移学习的质量预测效果,为复杂的小批量生产过程质量保证提供了新方法。 展开更多
关键词 小批量生产质量预测 深度迁移学习 smote IKPCA SeNet
在线阅读 下载PDF
SMOTE类算法研究综述 被引量:4
5
作者 王晓霞 李雷孝 林浩 《计算机科学与探索》 CSCD 北大核心 2024年第5期1135-1159,共25页
合成少数类过采样技术(SMOTE)因能有效处理少数类样本已成为处理不平衡数据的主流方法之一,而且许多SMOTE改进算法已被提出,但目前已有的调研极少考虑到流行的算法级改进方法。因此对现有SMOTE类算法进行更全面的分析与总结。首先详细... 合成少数类过采样技术(SMOTE)因能有效处理少数类样本已成为处理不平衡数据的主流方法之一,而且许多SMOTE改进算法已被提出,但目前已有的调研极少考虑到流行的算法级改进方法。因此对现有SMOTE类算法进行更全面的分析与总结。首先详细阐述了SMOTE方法的基本原理,然后主要从数据级、算法级两个层面系统性地梳理分析SMOTE类算法,并介绍数据级和算法级混合改进的新思路。数据级改进是在预处理时通过不同操作删除或添加数据来平衡数据分布;算法级改进不会改变数据分布,主要通过修改或创建算法来加强对少数类样本的关注度。二者相比,数据级方法应用受限更少,算法级改进的算法鲁棒性普遍更高。为了更全面地提供SMOTE类算法的基础研究材料,最后列出常用数据集、评价指标,给出未来可能尝试进行的研究思路,以更好地应对不平衡数据问题。 展开更多
关键词 不平衡数据 合成少数类过采样技术(smote) 过采样 监督学习
在线阅读 下载PDF
小样本下基于SMOTE-IGWO-RF的轮毂电机轴承故障诊断
6
作者 葛平淑 王朝阳 +3 位作者 王阳 张涛 薛红涛 夏晨迪 《兵器装备工程学报》 CAS CSCD 北大核心 2024年第8期1-9,共9页
轮毂电机复杂多变的运行环境可能导致轴承故障而危及电动车辆行驶安全,为解决传统故障诊断方法在小样本条件下识别精度低的问题,提出一种基于SMOTE-IGWO-RF的轮毂电机轴承故障诊断方法。首先,通过合成少数过采样技术(SMOTE)扩展训练数据... 轮毂电机复杂多变的运行环境可能导致轴承故障而危及电动车辆行驶安全,为解决传统故障诊断方法在小样本条件下识别精度低的问题,提出一种基于SMOTE-IGWO-RF的轮毂电机轴承故障诊断方法。首先,通过合成少数过采样技术(SMOTE)扩展训练数据集,生成与真实样本分布相似的故障样本,并使用主成分分析(PCA)优化其时域和频域的特征。然后,通过引入非线性收敛因子和Levy飞行策略改进传统的灰狼优化算法(GWO),使用改进的灰狼优化算法(IGWO)优化随机森林(RF)模型的参数。最后,基于SMOTE-IGWO-RF的轮毂电机轴承故障诊断模型实现故障状态的识别,并在轮毂电机试验台架上进行了实验验证。结果表明,所提出的轮毂电机轴承故障诊断方法在7种转速工况下平均准确率均超过96%,具有高精度和稳定性。与遗传算法(GA)、粒子群优化算法(PSO)、GWO优化RF相比,提出的IGWO-RF模型在3种小样本训练集下的诊断准确率均超过90%,且准确率均明显高于其他3个对比算法,能够有效实现小样本条件下的轮毂电机轴承故障诊断。 展开更多
关键词 轮毂电机 轴承 合成少数类过采样技术(smote) 改进灰狼优化算法(IGWO) 随机森林(RF) 故障诊断
在线阅读 下载PDF
基于SMOTE-UVE-SVM的小麦种子纯度高光谱图像检测 被引量:1
7
作者 朱潘雨 黄敏 赵鑫 《激光技术》 CAS CSCD 北大核心 2024年第2期281-287,共7页
为了解决基于高光谱成像技术的小麦种子纯度检测过程中样本不均衡及波段信息冗余导致纯度检测模型性能下降的问题,提出了一种融合合成少数类过采样技术(SMOTE)、非信息变量剔除(UVE)和支持向量机(SVM)的种子纯度高光谱检测模型。该模型... 为了解决基于高光谱成像技术的小麦种子纯度检测过程中样本不均衡及波段信息冗余导致纯度检测模型性能下降的问题,提出了一种融合合成少数类过采样技术(SMOTE)、非信息变量剔除(UVE)和支持向量机(SVM)的种子纯度高光谱检测模型。该模型利用SMOTE算法对小麦种子少数类(杂质)样本进行扩充,改善样本的不均衡性;同时利用UVE对高维的高光谱特征进行选择,并构建SVM模型作为分类器,以进一步提高分类的性能。结果表明,5类小麦种子的平均准确率、精确率和负样本检出率分别达到95.98%、94.94%和89.32%,较传统方法分别提高了3.89%、7.18%和12.42%。所提出的方法在基于高光谱成像技术的小麦种子纯度检测中具有较好的应用前景。 展开更多
关键词 光谱学 高光谱成像技术 合成少数类过采样技术 非信息变量剔除 种子纯度
在线阅读 下载PDF
基于LLE-DBSCAN-SMOTE数据处理的隧洞岩爆预测
8
作者 范成强 夏元友 +1 位作者 张宏伟 黄建 《中国安全科学学报》 CSCD 北大核心 2024年第12期140-148,共9页
为解决岩爆预测中预测指标关联以及原始数据存在离群点与数据不平衡等问题,提出基于局部线性嵌入(LLE)-基于密度的带噪声应用空间聚类(DBSCAN)-合成少数类过采样(SMOTE)数据处理的岩爆预测方法。首先,选取围岩最大切向应力σ_(θ)、岩... 为解决岩爆预测中预测指标关联以及原始数据存在离群点与数据不平衡等问题,提出基于局部线性嵌入(LLE)-基于密度的带噪声应用空间聚类(DBSCAN)-合成少数类过采样(SMOTE)数据处理的岩爆预测方法。首先,选取围岩最大切向应力σ_(θ)、岩石单轴抗压强度σ_(c)、岩石单轴抗拉强度σ_(t)、弹性应变能指数W_(et)、脆性系数σ_(c)/σ_(t)、应力系数σ_(θ)/σ_(c)和表征围岩应力梯度的应力集度值β构建岩爆预测指标体系;其次,采用LLE算法进行数据降维处理以消除指标间的交叉关联影响,引入DBSCAN算法去除数据离群点;然后,引入SMOTE技术进行数据平衡化;最后,分别采用决策树(DT)、随机森林(RF)与梯度提升树(GBDT)算法构建3类岩爆预测模型,对比分析数据处理前后数据训练模型的预测精度,并通过江边水电站引水隧洞实测岩爆数据进行工程验证。结果表明:预测指标由原始数据的7维降至4维,以及采用分级离群值处理后的3类算法模型的预测准确率皆为同类模型中最高,江边水电站工程岩爆预测验证了数据处理后的模型预测准确率明显高于基于原始岩爆数据建立的同类模型。 展开更多
关键词 局部线性嵌入(LLE) 基于密度的带噪声应用空间聚类(DBSCAN) 合成少数类过采样(smote) 数据处理 岩爆预测
在线阅读 下载PDF
基于SMOTE-SSA-CNN的开关柜故障诊断方法
9
作者 张玮 《电气传动》 2024年第10期83-89,共7页
开关柜多源监测数据包含丰富的设备运行状态信息,对其进行分析可实现开关柜故障诊断。提出一种基于SMOTE-SSA-CNN的开关柜故障诊断方法。首先,以开关柜电压、电流和温湿度等监测数据为基础,采用合成少数类样本过采样技术(SMOTE)算法对... 开关柜多源监测数据包含丰富的设备运行状态信息,对其进行分析可实现开关柜故障诊断。提出一种基于SMOTE-SSA-CNN的开关柜故障诊断方法。首先,以开关柜电压、电流和温湿度等监测数据为基础,采用合成少数类样本过采样技术(SMOTE)算法对原始数据集进行样本扩充,解决原始数据集中正负样本严重失衡的问题;然后引入麻雀搜索算法(SSA)对卷积神经网络(CNN)的卷积核大小与数量、全连接层神经元数量、学习率等超参数进行优化,提高模型故障诊断结果的准确率;最后,通过算例分析对建立的SMOTE-SSA-CNN模型性能进行评估,验证了所提方法对开关柜故障诊断的有效性,且与传统故障诊断方法相比,所提方法的收敛性较好,精度较高。 展开更多
关键词 开关柜 多源监测数据 合成少数类样本过采样技术算法 麻雀搜索算法 卷积神经网络
在线阅读 下载PDF
面向不平衡数据集的改进型SMOTE算法 被引量:26
10
作者 王超学 张涛 马春森 《计算机科学与探索》 CSCD 2014年第6期727-734,共8页
针对SMOTE(synthetic minority over-sampling technique)在合成少数类新样本时存在的不足,提出了一种改进的SMOTE算法GA-SMOTE。该算法的关键将是遗传算法中的3个基本算子引入到SMOTE中,利用选择算子实现对少数类样本有区别的选择,使... 针对SMOTE(synthetic minority over-sampling technique)在合成少数类新样本时存在的不足,提出了一种改进的SMOTE算法GA-SMOTE。该算法的关键将是遗传算法中的3个基本算子引入到SMOTE中,利用选择算子实现对少数类样本有区别的选择,使用交叉、变异算子实现对合成样本质量的控制。结合GA-SMOTE与SVM(support vector machine)算法来处理不平衡数据的分类问题。UCI数据集上的大量实验表明,GA-SMOTE在新样本的整体合成效果上表现出色,有效提高了SVM在不平衡数据集上的分类性能。 展开更多
关键词 不平衡数据集 分类 遗传算子 少数类样本合成过采样技术(smote) synthetic minority OVER-SAMPLING technique (smote)
在线阅读 下载PDF
基于改进SMOTE的非平衡数据集分类研究 被引量:19
11
作者 王超学 潘正茂 +2 位作者 董丽丽 马春森 张星 《计算机工程与应用》 CSCD 2013年第2期184-187,245,共5页
针对SMOTE(Synthetic Minority Over-sampling Technique)在合成少数类新样本时存在的不足,提出了一种改进的SMOTE算法(SSMOTE)。该算法的关键是将支持度概念和轮盘赌选择技术引入到SMOTE中,并充分利用了异类近邻的分布信息,实现了对少... 针对SMOTE(Synthetic Minority Over-sampling Technique)在合成少数类新样本时存在的不足,提出了一种改进的SMOTE算法(SSMOTE)。该算法的关键是将支持度概念和轮盘赌选择技术引入到SMOTE中,并充分利用了异类近邻的分布信息,实现了对少数类样本合成质量和数量的精细控制。将SSMOTE与KNN(K-Nearest Neighbor)算法结合来处理不平衡数据集的分类问题。通过在UCI数据集上与其他重要文献中的相关算法进行的大量对比实验表明,SSMOTE在新样本的整体合成效果上表现出色,有效提高了KNN在非平衡数据集上的分类性能。 展开更多
关键词 非平衡数据集 分类 支持度 轮盘赌选择 合成少数过采样技术(smote)
在线阅读 下载PDF
面向不均衡数据集的ISMOTE算法 被引量:13
12
作者 许丹丹 王勇 蔡立军 《计算机应用》 CSCD 北大核心 2011年第9期2399-2401,共3页
为了提高不均衡数据集中少数类的分类性能,提出ISMOTE算法。它是在少数类实例及其最近邻少数类实例构成的n维球体内进行随机插值,从而来改进数据分布的不均衡程度。通过实际数据集上的实验,与SMOTE算法和直接分类不均衡数据算法的性能... 为了提高不均衡数据集中少数类的分类性能,提出ISMOTE算法。它是在少数类实例及其最近邻少数类实例构成的n维球体内进行随机插值,从而来改进数据分布的不均衡程度。通过实际数据集上的实验,与SMOTE算法和直接分类不均衡数据算法的性能比较结果表明,ISMOTE算法具有更高的分类精度,可以有效地改进分类器的性能。 展开更多
关键词 不均衡数据集 分类 虚拟实例 少数类过抽样算法
在线阅读 下载PDF
构造性覆盖算法的SMOTE过采样方法 被引量:9
13
作者 严远亭 朱原玮 +2 位作者 吴增宝 张以文 张燕平 《计算机科学与探索》 CSCD 北大核心 2020年第6期975-984,共10页
如何提高对少数类样本的识别能力是不平衡数据分类中的一个研究热点。合成少数类过采样技术(SMOTE)是解决此类问题的代表性方法之一。近年来,不少研究者对SMOTE做出了一些改进,较好地提高了该方法的性能。然而,如何有效地选取典型少数... 如何提高对少数类样本的识别能力是不平衡数据分类中的一个研究热点。合成少数类过采样技术(SMOTE)是解决此类问题的代表性方法之一。近年来,不少研究者对SMOTE做出了一些改进,较好地提高了该方法的性能。然而,如何有效地选取典型少数类样本进行过采样仍然是一个值得研究的问题。此外,被孤立的少数样本在提高模型性能方面的潜在能力也没有得到足够的重视。针对上述问题,提出了基于构造性覆盖算法(CCA)的过采样技术CMOTE。CMOTE提供了两种不同策略下选择关键样本的方法:基于覆盖内样本个数的方法与基于覆盖密度的方法。在12个典型的不平衡数据集上验证CMOTE算法的性能。实验结果表明,CMOTE算法在总体上优于对比方法,并且通过强化关键样本对模型性能的影响增强了模型的泛化能力。 展开更多
关键词 不平衡数据 过采样技术 合成少数类过采样技术(smote) 构造性覆盖算法(CCA)
在线阅读 下载PDF
基于SMOTE算法和条件生成对抗网络的到港航班延误分类预测 被引量:7
14
作者 刘博 卢婷婷 +1 位作者 张兆宁 张健斌 《科学技术与工程》 北大核心 2021年第34期14843-14852,共10页
由于航班延误数据集类别分布不均,传统分类器的性能受到一定程度的制约。为了能够对到港航班延误情况进行精准预测,提出了一种基于合成少数类过采样技术(synthetic minority oversampling technique,SMOTE)算法和条件生成对抗网络(condi... 由于航班延误数据集类别分布不均,传统分类器的性能受到一定程度的制约。为了能够对到港航班延误情况进行精准预测,提出了一种基于合成少数类过采样技术(synthetic minority oversampling technique,SMOTE)算法和条件生成对抗网络(conditional generative adversarial nets,CGAN)的航班延误预测模型。首先,利用SMOTE算法对原始数据集进行上采样,并融合经过训练的CGAN生成指定样本数据集,缓解原始数据集中某些类别样本量少和数据非平衡等问题;再次,采用XGBoost模型在4种模式训练集上进行训练和超参数寻优;最后,以K近邻、支持向量机和随机森林为基准模型进行性能对比分析。经试验分析,通过分类器在融合样本集的训练,整体上可以在一定程度上提高模型的泛化性,尤其在轻度延误和中度延误类别中提升较为明显,与不采用融合方法比较,宏平均下的Precision、Recall、F_(1)-score值分别提升了0.16、0.29、0.24个百分点。实验结果表明,该方法能够有效地对航班延误非平衡数据进行建模,在保持模型整体性能较高的前提下,能够显著地提升少数类的预测能力,可以为空管、航空公司和机场等提供决策依据。 展开更多
关键词 航班延误 非平衡数据集 合成少数类过采样技术(smote)算法 条件生成对抗网络 XGBoost模型 分类问题
在线阅读 下载PDF
基于改进Smote-GBDT算法的岩爆预测模型 被引量:3
15
作者 宋英华 江晨 +1 位作者 李墨潇 齐石 《中国安全科学学报》 CAS CSCD 北大核心 2023年第9期25-32,共8页
为准确预测岩爆等级,确保施工人员和设备安全,首先,从岩爆机制、数据和算法角度,分析埋深(D)、单轴抗压强度(UCS)、单轴抗拉强度(UTS)、岩石脆性指数(B_(1)、B_(2))、围岩最大切向应力(MTS)、应力集中系数(SCF)和弹性变形能指数(W_(et))... 为准确预测岩爆等级,确保施工人员和设备安全,首先,从岩爆机制、数据和算法角度,分析埋深(D)、单轴抗压强度(UCS)、单轴抗拉强度(UTS)、岩石脆性指数(B_(1)、B_(2))、围岩最大切向应力(MTS)、应力集中系数(SCF)和弹性变形能指数(W_(et))8个指标,建立岩爆预测指标体系;其次,针对岩爆样本存在的数据不均衡问题,引进托梅克联系(Tomek Link)对欠采样方法,改进合成少数类过采样(Smote)算法,对岩爆训练样本进行混合过采样;最后,构建SmoteTomek-梯度提升树(GBDT)岩爆预测模型,以38组数据验证模型的有效性,并与其他模型进行对比。结果表明:SmoteTomek-GBDT的准确率为92.1%,较未采样提升5.3%,Smote采样提升10.5%,优于随机过采样模型,并且避免跨等级的岩爆误判。 展开更多
关键词 岩爆预测 梯度提升树(GBDT)算法 合成少数类过采样(smote)算法 岩爆指标 托梅克联系(Tomek Link)
在线阅读 下载PDF
融合nmODE的术后肺部并发症预测模型
16
作者 熊立鹏 徐修远 +2 位作者 牛颢 陈楠 章毅 《智能系统学报》 北大核心 2025年第1期198-205,共8页
为了准确预测病人肺部手术后并发症的发生,提出了一种融合神经记忆常微分方程(neural memory ordinary differential equation,nmODE)的并发症预测模型。首先,利用极限梯度提升(extreme gradient boosting,XGBoost)树结构对数据进行编码... 为了准确预测病人肺部手术后并发症的发生,提出了一种融合神经记忆常微分方程(neural memory ordinary differential equation,nmODE)的并发症预测模型。首先,利用极限梯度提升(extreme gradient boosting,XGBoost)树结构对数据进行编码,并提取其特征重要性。然后,使用长短时记忆神经网络对数据的相关特征依赖性进行分析,并提取处理后的特征。最后,利用nmODE的记忆和学习能力,对提取的特征进行深入分析,并得出最终的预测结果。通过实验评估,在肺部术后并发症数据集中,证明了提出模型的效果优于现有模型,同时可以为预测肺部手术后并发症的发生提供更准确的结果。 展开更多
关键词 疾病预测 异构表格数据 神经记忆常微分方程 极限梯度提升 长短时记忆神经网络 合成少数过采样技术 类别不平衡 病人预后
在线阅读 下载PDF
基于SMOTE和深度信念网络的异常检测 被引量:21
17
作者 沈学利 覃淑娟 《计算机应用》 CSCD 北大核心 2018年第7期1941-1945,共5页
针对现有海量非平衡数据集中少数类别样本入侵检测率低的问题,提出了一种基于合成少数类过采样技术(SMOTE)和深度信念网络(DBN)的异常检测(SMOTE-DBN)方法。首先,用SMOTE技术增加了少数类别样本的样本数;然后在预处理后的较平衡数据集上... 针对现有海量非平衡数据集中少数类别样本入侵检测率低的问题,提出了一种基于合成少数类过采样技术(SMOTE)和深度信念网络(DBN)的异常检测(SMOTE-DBN)方法。首先,用SMOTE技术增加了少数类别样本的样本数;然后在预处理后的较平衡数据集上,用非监督的受限玻尔兹曼机(RBM)对预处理后的高维数据进行特征降维;其次,用反向传播(BP)算法微调模型参数,获得预处理后数据的较优低维表示;最后通过softmax分类器对较优低维数据进行分类。KDD1999数据集仿真实验表明,SMOTE优化处理能够提高模型对少数类别样本的检测率,在相同数据集上,SMOTE-DBN方法与DBN方法、支持向量机(SVM)方法相比,检测率分别提高了3.31个百分点和7.34个百分点,误报率分别降低了1.11个百分点和2.67个百分点。 展开更多
关键词 合成少数类过采样技术 深度信念网络 受限玻尔兹曼机 逻辑回归 入侵检测
在线阅读 下载PDF
一种自适应核SMOTE-SVM算法用于不平衡数据分类 被引量:13
18
作者 吴海燕 陈晓磊 范国轩 《北京化工大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第2期97-104,共8页
面向不平衡样本集,提出一种自适应核人工合成过采样-支持向量机(synthetic minority oversampling technique-support vector machine,SMOTE-SVM)分类算法。首先通过支持向量机将数据集投影到核空间,找出类边界样本—支持向量(SV),然后... 面向不平衡样本集,提出一种自适应核人工合成过采样-支持向量机(synthetic minority oversampling technique-support vector machine,SMOTE-SVM)分类算法。首先通过支持向量机将数据集投影到核空间,找出类边界样本—支持向量(SV),然后基于核距离对少数类样本集的支持向量(SV+)计算其近邻,再根据近邻样本类别分布自适应地选择内插或外推两种方式合成新样本。由于核空间中映射函数无法具体得知,新样本无法用显式表示,因此将生成样本与原始样本一起形成增广Gram矩阵,最终利用SVM实现分类。该算法中样本生成、近邻计算以及SVM分类均统一在同一核空间中,提高了新样本的可信性;同时自适应插值方式改善了传统人工合成过采样技术(SMOTE)线性生成算法不适用于非线性分类的问题,提高了新样本的多样性。在多个数据集上的实验结果表明,所提算法可以改善不平衡数据的分类准确率,具有更好的稳健性。 展开更多
关键词 不平衡数据分类 人工合成过采样技术(smote) 核空间 支持向量机
在线阅读 下载PDF
不平衡样本下基于变异麻雀搜索算法和改进SMOTE的变压器故障诊断方法 被引量:6
19
作者 朱莉 汪小豪 +2 位作者 李豪 姜成龙 曹明海 《高电压技术》 EI CAS CSCD 北大核心 2023年第12期4993-5001,共9页
针对麻雀搜索算法同质化严重和变压器故障样本不平衡导致分类效果不佳的问题,提出了变异麻雀搜索算法优化支持向量机(variation sparrow search algorithm-support vector machine,VSSA-SVM)和改进合成少数过采样技术(improved syntheti... 针对麻雀搜索算法同质化严重和变压器故障样本不平衡导致分类效果不佳的问题,提出了变异麻雀搜索算法优化支持向量机(variation sparrow search algorithm-support vector machine,VSSA-SVM)和改进合成少数过采样技术(improved synthetic minority over-sampling technique,ISMOTE)的变压器故障诊断方法。首先使用Tomek Link对数据集进行去噪,引入中心偏移权重(center offset weight,COW)改进SMOTE算法对不平衡数据集的少数类样本进行合成,得到平衡化处理后的变压器故障数据集。然后,基于变异的思想,构建VSSA-SVM的变压器故障诊断模型。最后,在413例油浸变压器的油中溶解气体分析(dissoived gas anaiysis,DGA)数据上,使用PSO-SVM、SSA-SVM和VSSA-SVM模型进行诊断,诊断结果分别为81.45%、88.71%和96.77%,同时与SMOTE-NND、SVM SMOTE、Borderline-SMOTE、SMOTE以及原始数据集方法相比,ISMOTE分别提升了3.22%、4.03%、6.45%、7.52%、11.29%。结果表明,该文所提方法能准确判别变压器的故障状态,有效解决故障数据不平衡导致分类精度低的问题,具有一定的工程实用价值。 展开更多
关键词 变压器 故障诊断 不平衡样本 改进合成少数过采样 变异麻雀搜索算法
在线阅读 下载PDF
融合过-欠采样与GAN的网络入侵检测方法
20
作者 王秀玉 吴晓鸰 冯永晋 《小型微型计算机系统》 北大核心 2025年第2期449-455,共7页
随着互联网技术的发展,网络数据流量每秒激增,伴随而来更多的安全问题.针对网络入侵数据集类不平衡和数据维度高导致的分类不准确问题,本文提出一种融合过-欠采样和GAN的网络入侵检测方法.采用随机欠采样减少多数类样本数量,以避免欠拟... 随着互联网技术的发展,网络数据流量每秒激增,伴随而来更多的安全问题.针对网络入侵数据集类不平衡和数据维度高导致的分类不准确问题,本文提出一种融合过-欠采样和GAN的网络入侵检测方法.采用随机欠采样减少多数类样本数量,以避免欠拟合问题.同时,通过合成少数类过采样技术合成少数类样本,以降低类不平衡所带来的影响.此外,结合GAN使合成样本更接近真实样本,以解决SMOTE中新合成样本缺乏合理性的问题.最后,集成自编码器,通过降低数据集的维度来减少内存占用,并加速分类模型的训练.在CICIDS2017数据集上进行对比实验,结果表明本文提出的融合过-欠采样和GAN的网络入侵检测方法性能优于其他方法. 展开更多
关键词 网络入侵检测 生成对抗网络 smote 自编码器
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部