期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
数字经济对创业的赋能效应研究——基于机器学习与SHAP分析的实证检验
1
作者 姜诗尧 李川泉 《西安石油大学学报(社会科学版)》 2025年第2期55-62,79,共9页
基于2011—2022年中国30个省级行政区的面板数据,通过机器学习的随机森林回归模型并引入SHAP分析方法,实证分析了数字经济对创业的赋能效应。研究发现:(1)数字经济显著提升了我国各省域的创业活跃度与创业质量;(2)数字经济的数字产业化... 基于2011—2022年中国30个省级行政区的面板数据,通过机器学习的随机森林回归模型并引入SHAP分析方法,实证分析了数字经济对创业的赋能效应。研究发现:(1)数字经济显著提升了我国各省域的创业活跃度与创业质量;(2)数字经济的数字产业化、产业数字化和信息基础设施等维度对于创业活跃度与创业质量具有差异化赋能作用。提出持续促进数字经济创新动能;提升信息基础设施利用效率;加速释放数字产业化发展潜能;推动数字与实体产业深度融合,以期构建全产业链发展模式,提升创业活跃度和竞争力。 展开更多
关键词 数字经济 创业活跃度 创业质量 机器学习 shap分析
在线阅读 下载PDF
土石坝风险等级智能预测分析及模型优化研究 被引量:2
2
作者 李炎隆 张雨春 +2 位作者 王婷 殷乔刚 刘云贺 《水力发电学报》 CSCD 北大核心 2024年第7期85-96,共12页
大坝溃坝会造成大量的生命财产损失和巨大的环境破坏。精准快速确定土石坝风险等级,对于控制土石坝溃坝危害具有重要意义。本文采用K-最近邻(KNN)算法填补了数据库中大量缺失数据,引入遗传优化算法(GA)优化轻量级梯度提升机(LightGBM)... 大坝溃坝会造成大量的生命财产损失和巨大的环境破坏。精准快速确定土石坝风险等级,对于控制土石坝溃坝危害具有重要意义。本文采用K-最近邻(KNN)算法填补了数据库中大量缺失数据,引入遗传优化算法(GA)优化轻量级梯度提升机(LightGBM)超参数,建立了基于GA-LightGBM的土石坝风险等级快速预测模型。采用受试者工作特征曲线(ROC)、曲线下面积(AUC)值等其他评价指标对模型精度进行验证,并将其与传统机器学习模型进行了对比。研究表明,所提模型预测准确率为89.95%,准确度最高。模型的AUC值为0.977,说明模型在适用性和预测精度方面都优于传统预测模型。采用SHAP分析对该模型进行了全局影响因素分析及案例分析,结果表明,检查频次是导致土石坝风险最重要的影响因素之一。 展开更多
关键词 风险等级 遗传算法 GA-LightGBM 快速预测模型 shap分析
在线阅读 下载PDF
智能遮阳百叶眩光预测模型控制变量有效性分析 被引量:1
3
作者 骆肇阳 齐轩宁 杨阳 《照明工程学报》 2024年第1期89-100,共12页
基于预测模型的智能遮阳百叶调控系统具有降低建筑室内眩光性能的能力,其智能性取决于调控方法。而调控方法的设计取决于对室内采光性能相关影响信息的思考。不同影响信息是调控反馈的依据,也是智能预测模型建构的基础。本研究利用机器... 基于预测模型的智能遮阳百叶调控系统具有降低建筑室内眩光性能的能力,其智能性取决于调控方法。而调控方法的设计取决于对室内采光性能相关影响信息的思考。不同影响信息是调控反馈的依据,也是智能预测模型建构的基础。本研究利用机器学习技术,对不同百叶控制变量展开眩光关联性分析,以及不同控制变量在眩光影响上的交互效应。利用XGBoost构建预测模型与展开特征选择,同时采用SHAP可解释方法进一步解析变量与眩光关联大小。研究结果表明,室内使用者所在区域与遮阳百叶之间距离、遮阳形变与眩光发生最为紧密,且互动性影响明显,同时太阳高度角也是遮阳百叶重要的响应信息。结论可为智能遮阳百叶调控系统设计和预测模型建构提供参考依据。 展开更多
关键词 智能遮阳 预测模型 自然采光优化 机器学习 特征选择 XGBoost模型 shap分析
在线阅读 下载PDF
基于XGBOOST-SHAP的地铁建成环境与站点出行距离的非线性关系研究 被引量:6
4
作者 李培坤 陈旭梅 +3 位作者 鲁文博 马嘉欣 刘屹 王昊 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第4期1624-1633,共10页
相较于传统地铁客流量特征分析,地铁站点平均出行距离的研究可以更加精细化了解地铁网络客流流动性特征。为探究多重建成环境与站点平均出行距离之间的复杂关系,以西安市地铁系统为研究对象,从土地利用、兴趣点分布、周边交通建成环境... 相较于传统地铁客流量特征分析,地铁站点平均出行距离的研究可以更加精细化了解地铁网络客流流动性特征。为探究多重建成环境与站点平均出行距离之间的复杂关系,以西安市地铁系统为研究对象,从土地利用、兴趣点分布、周边交通建成环境、站点自身属性等方面构建11种建成环境指标,建立基于极端梯度提升的XGBOOST-SHAP归因分析架构的可解释性机器学习模型,以揭示两者之间的非线性关系。同时,将该模型拟合回归效果与梯度提升决策树(GBDT)及最小二乘回归(OLS)进行比较,以验证XGBOOST模型在拟合回归效果上的优势。结果表明:XGBOOST模型的R方、平均绝对误差(MAE)、均方误差(MSE)值分别为0.75、0.95、1.36,其拟合效果要优于GBDT与OLS模型。站点平均出行距离呈现出明显的环状分布的空间异质性。SHAP归因分析结果表明:距市中心距离特征贡献最大,路网密度、土地利用混合度、公交线路数量以及住宅数量对出行距离的贡献度也相对较高;POI香农熵指数、餐饮服务点对平均出行距离的正负反馈不明显;其余指标对平均出行距离的影响均呈现出正负反馈机制结合的趋势。研究结果对交通需求分析、线路容量优化、运营效果评估等提供了数据支撑,可有效提高地铁交通便利性,满足不同区域的出行需求并改善整个地铁系统的效率和可持续性。 展开更多
关键词 地铁站点 建成环境 出行距离 XGBOOST模型 shap归因分析 非线性关系
在线阅读 下载PDF
基于机器学习的糖尿病预测及SHAP特征分析 被引量:8
5
作者 李佳思 《智能计算机与应用》 2023年第1期153-157,共5页
为了提升糖尿病诊断的准确率,找出糖尿病的影响因素,将机器学习算法应用于糖尿病诊断,建立糖尿病预测模型,为医生提供决策指导。实验使用UCI数据库中的皮马印第安人糖尿病数据集,首先对数据进行缺失值填充、异常值处理与标准化等预处理... 为了提升糖尿病诊断的准确率,找出糖尿病的影响因素,将机器学习算法应用于糖尿病诊断,建立糖尿病预测模型,为医生提供决策指导。实验使用UCI数据库中的皮马印第安人糖尿病数据集,首先对数据进行缺失值填充、异常值处理与标准化等预处理;在经过预处理后的数据集上建立单分类模型和集成学习模型,并通过5折交叉验证准确率和AUC值评估各模型的预测性能。结果表明,XGBoost算法的预测效果最好,分类准确率达到77.83%,AUC值为0.822。最后,引入SHAP模型增强模型的可解释性,归纳得出葡萄糖浓度、身体质量指数和年龄对糖尿病预测具有重要影响。 展开更多
关键词 糖尿病 机器学习 疾病诊断 shap特征分析
在线阅读 下载PDF
基于SHAP-RF模型的不同路面状态下山区高速公路路表温度实时估计
6
作者 苏宇 李京阳 +2 位作者 熊昌安 岳松 杨文臣 《西安理工大学学报》 北大核心 2024年第4期545-553,共9页
为实现山区高速公路路表温度的实时精准预估,以云南省麻昭高速公路2年的分钟级气象数据为基础,采用SHAP归因分析法筛选重要特征参数组合作为模型输入,采用随机森林回归算法(RFR)构建不同路面状态下的山区高速公路路表温度实时估计模型,... 为实现山区高速公路路表温度的实时精准预估,以云南省麻昭高速公路2年的分钟级气象数据为基础,采用SHAP归因分析法筛选重要特征参数组合作为模型输入,采用随机森林回归算法(RFR)构建不同路面状态下的山区高速公路路表温度实时估计模型,并与轻量级梯度提升机(LightGBM)、极限梯度提升(XGBoost)、多元线性回归(MLR)等经典模型进行对比,综合分析模型的准确度。结果表明:①干燥和潮湿两种路面状态下的交通气象特征对路表温度的贡献重要度排序不尽相同;②干燥状态下的模型最佳输入组合为气温+时间+相对湿度+气压,潮湿状态下的模型最佳输入组合为气温+气压+时间+相对湿度+湿滑系数;③相较于3个比较模型,SHAP-RF模型的预估效果最佳,在干燥和潮湿状态下的MAE分别为1.046℃和0.367℃。研究成果可为山区高速公路低成本交通气象环境智能感知与冰雪灾害防治技术提供依据。 展开更多
关键词 交通安全 路表温度 shap归因分析 随机森林回归 多维气象因素 山区高速公路
在线阅读 下载PDF
基于不同机器学习方法的建筑工程造价预测研究 被引量:1
7
作者 王晓红 梁帅锋 《建筑经济》 2024年第S01期246-251,共6页
工程造价预测是建筑行业中重要的工作,准确地预测工程造价对于前期的投资决策具有重要的现实意义。为了提高造价预测的准确性,本文提出一种应用集成学习算法(XGBoost)和单一学习算法(BP、SSA-BP)构建预测模型的方法,采用统计学习的方法... 工程造价预测是建筑行业中重要的工作,准确地预测工程造价对于前期的投资决策具有重要的现实意义。为了提高造价预测的准确性,本文提出一种应用集成学习算法(XGBoost)和单一学习算法(BP、SSA-BP)构建预测模型的方法,采用统计学习的方法得到8种对工程造价有影响的变量因素:总建筑面积、高度、层数、层高、基础类型、结构形式、抗震烈度和外立面材料。以8种影响因素作为模型的输入变量,单位造价作为输出变量,通过对预测结果的指标评估得出单一学习算法中SSA-BP模型的预测性能最好。在此预测模型的基础上,使用SHAP分析方法,得到8种变量因素在模型中的重要性占比排序,并以此重新构建8种不同组合的输入变量来检验SSA-BP模型的可靠度。 展开更多
关键词 造价预测 机器学习 麻雀算法 shap分析
在线阅读 下载PDF
基于改进Transformer模型的短期风电功率预测
8
作者 陈月强 伍磊 黄桦 《电工技术》 2024年第22期24-28,共5页
针对风电功率预测准确率不高的问题,建立了基于多元特征的降噪Transformer模型,对短期风电功率进行预测。首先介绍了一种通过计算特征的贡献来解释机器学习模型预测结果的Shapley Additive exPlanations(SHAP)模型,以此描述多元特征对... 针对风电功率预测准确率不高的问题,建立了基于多元特征的降噪Transformer模型,对短期风电功率进行预测。首先介绍了一种通过计算特征的贡献来解释机器学习模型预测结果的Shapley Additive exPlanations(SHAP)模型,以此描述多元特征对模型输出的贡献度。其次分析了Transformer模型的结构及预测原理,并针对原始数据夹杂大量噪声这一缺陷,在传统Transformer预测模型基础上增加去噪环节,建立基于改进Transformer模型的短期风电功率预测模型,凭借噪声学习过程获取有效数据,提高预测模型的鲁棒性。最后引入江苏省某风电场实测数据对多种模型的预测效果进行对比,验证了所提出方法的有效性。 展开更多
关键词 风力发电 功率预测 shap分析 降噪Transformer模型
在线阅读 下载PDF
基于无创生理参数的家用慢阻肺疾病分类方法
9
作者 王慧泉 赵伟标 +3 位作者 孟庆凯 马建新 童朝晖 曹志新 《生物医学工程研究》 2023年第1期23-29,共7页
为实现居家环境下慢性阻塞性肺疾病(chronic obstructive pulmonary disease, COPD)患者的病期监测,本研究设计了不同病期患者呼吸波形的采集实验,探究了基于呼吸波形提取的16个无创生理参数(non-invasive physiological parameters, N... 为实现居家环境下慢性阻塞性肺疾病(chronic obstructive pulmonary disease, COPD)患者的病期监测,本研究设计了不同病期患者呼吸波形的采集实验,探究了基于呼吸波形提取的16个无创生理参数(non-invasive physiological parameters, NPP)及13个呼吸机统计参数(statistical parameters, STA)在COPD不同病期的分类效果,并基于支持向量机建立病期分类模型。结果表明,在NPP中,从压力波形中提取的峰值间隔序列一阶差分序列的标准差、均方根、方差和峰值间隔序列的变异系数对模型分类效果的贡献度最大。在三种输入不同特征参数的分类模型中,NPP、STA和NPP-STA的平均准确率分别为82%、67%和89%,AUC值分别为0.90、0.80和0.95。NPP-STA分类模型更适用于居家环境下COPD患者的病情分类,可用于日常疾病状况筛查,辅助医生对COPD患者进行诊断和管理。 展开更多
关键词 慢阻肺 特征提取 机器学习 呼吸疾病管理 呼吸波 shap分析
在线阅读 下载PDF
地铁站周边建成环境对交通事故风险的影响机制 被引量:2
10
作者 戢晓峰 乔新 +2 位作者 普永明 卢梦媛 郝京京 《中国安全科学学报》 CAS CSCD 北大核心 2022年第10期162-170,共9页
为探究地铁站客流及周边建成环境对辐射范围内交通事故风险的影响机制,建立“5D+S”的建成环境指标体系,构建基于极度梯度提升(XG Boost)算法的事故风险模型及SHAP归因分析模型,探究建成环境与交通事故风险的非线性关系;以深圳市为例,... 为探究地铁站客流及周边建成环境对辐射范围内交通事故风险的影响机制,建立“5D+S”的建成环境指标体系,构建基于极度梯度提升(XG Boost)算法的事故风险模型及SHAP归因分析模型,探究建成环境与交通事故风险的非线性关系;以深圳市为例,从工作日和非工作日2个维度探究地铁站周边交通事故风险的影响机制,并与弹性网络回归(ENR)、支持向量回归机(SVR)等模型对比。研究表明:地铁站周边建成环境指标与交通事故风险存在非线性关系;当休闲娱乐兴趣点(POI)设施密度大于25个/km^(2)时,交通事故风险较大;当购物中心可达性介于[0.3,0.5]km之间,交通事故风险较大;地铁站周边建成环境因素对工作日交通事故风险影响程度更大。 展开更多
关键词 地铁站周边 交通事故风险 极度梯度提升算法(XG Boost) 建成环境 shap归因分析
在线阅读 下载PDF
建成环境对行人交通事故严重程度的非线性影响 被引量:8
11
作者 戢晓峰 乔新 《交通运输系统工程与信息》 EI CSCD 北大核心 2023年第1期314-323,共10页
为探索建成环境对行人交通事故的影响并为行人事故预防提供理论依据,本文以建成环境“5D”要素为基础,围绕土地利用、城市设计和交通系统这3个维度构建昼夜建成环境指标体系,基于轻度梯度提升机构建昼-夜间行人交通事故严重程度模型,探... 为探索建成环境对行人交通事故的影响并为行人事故预防提供理论依据,本文以建成环境“5D”要素为基础,围绕土地利用、城市设计和交通系统这3个维度构建昼夜建成环境指标体系,基于轻度梯度提升机构建昼-夜间行人交通事故严重程度模型,探究城市建成环境对行人交通事故严重程度的影响机制,结合SHAP(Shapley Additive Explanation)归因分析方法揭示两者之间的非线性关系,并以深圳市为例进行实证分析。结果表明:建成环境对行人交通事故的影响效应存在显著的时段异质性;昼间行人交通事故严重程度主要受人行道可达性、地铁站可达性及学校邻近度等因素的影响;夜间行人交通事故严重程度主要受人行道可达性、娱乐兴趣点(POI)指标及道路照明条件等因素的影响。建成环境对行人交通事故严重程度存在显著的非线性影响。昼间时段学校邻近度介于[0,3]km时,地铁站可达性小于1 km时,对行人事故严重程度有较大抬升作用;夜间时段娱乐POI可达性小于0.5 km时,对行人事故严重程度有抬升作用;不论昼夜,人行道可达性对行人事故严重程度均有压降作用,且临街院门密度低的区域行人事故严重程度较高。昼-夜间模型均表现出优秀的效果,分类准确率分别为96.38%和92.08%。 展开更多
关键词 城市交通 行人交通事故严重程度 轻度梯度提升机 shap归因分析 建成环境
在线阅读 下载PDF
基于气象因素与特征选择的进港航班延误可解释预测研究 被引量:3
12
作者 王维莉 王逸文 《交通运输系统工程与信息》 EI CSCD 北大核心 2023年第5期162-171,共10页
航班延误预测对于提高旅客满意度和优化资源配置具有重要意义,然而,预测模型的不可见性限制了其进一步发展。为提高航班延误预测问题的准确性与可解释性,以某机场航线到港航班为例,在考虑机场不同气象因素的基础上,基于mRMR(max-Relevan... 航班延误预测对于提高旅客满意度和优化资源配置具有重要意义,然而,预测模型的不可见性限制了其进一步发展。为提高航班延误预测问题的准确性与可解释性,以某机场航线到港航班为例,在考虑机场不同气象因素的基础上,基于mRMR(max-Relevance and min-Redundancy)算法剔除冗余特征,筛选最优特征子集作为预测模型的输入,在比较多种机器学习算法后,选择Catboost算法,利用SHAP(Shapley Additive Explanation)归因分析方法,从局部解释和全局解释深入挖掘各因素对航班延误时间的不同影响程度,并采用偏依赖分析提取关键因素的最佳阈值。结果表明:经过特征选择后的Catboost预测模型能够更好地捕捉非线性特征,相比于未经过特征选择的模型,MAE(Mean Absolute Error)、RMSE(Root Mean Square Error)及MAPE(Mean Absolute Percentage Error)分别降低了3.84%,3.35%,4.22%,并利用DM(Diebold-Mariano)检验从统计学上检验模型的差异性;同时,航班延误时间受到多种气象特征以及前序延误等因素共同影响,其中,机场风速和降水量对延误时间有显著正向影响,而机场有效风力和能见度则对延误时间有显著负向影响。 展开更多
关键词 航空运输 航班延误预测 shap归因分析 进港航班 mRMR算法 Catboost算法
在线阅读 下载PDF
基于机器学习构建食管癌患者放射性食管炎预测模型
13
作者 高威 张玲 +2 位作者 吴田磊 胡丽丽 荣枫 《国际肿瘤学杂志》 2025年第1期31-37,共7页
目的基于机器学习(ML)算法构建食管癌患者同步放化疗(CRT)过程中发生≥2级放射性食管炎(RE)的预测模型。方法回顾性分析2018年1月至2023年1月在安徽医科大学附属六安医院接受CRT的276例食管癌患者的临床资料,根据美国放射肿瘤治疗协作... 目的基于机器学习(ML)算法构建食管癌患者同步放化疗(CRT)过程中发生≥2级放射性食管炎(RE)的预测模型。方法回顾性分析2018年1月至2023年1月在安徽医科大学附属六安医院接受CRT的276例食管癌患者的临床资料,根据美国放射肿瘤治疗协作组RE分级标准评估是否发生RE,以发生≥2级RE为结局事件。通过最小绝对值收敛和选择算子(LASSO)回归筛选变量后重新建立数据集,将数据集以7∶3的比例分为训练集(n=193)及测试集(n=83),纳入到随机森林(RF)、决策树(DT)、极端梯度提升(XGboost)、支持向量机(SVM)4种ML模型中。在训练集中进行数据训练、模型优化,测试集用于受试者操作特征(ROC)曲线评价模型效果,计算曲线下面积(AUC)、精确度、准确度、敏感性、F1分数对模型进行评估,使用SHAP分析解释最优模型。结果至随访结束,91例(32.97%)食管癌患者在CRT期间发生≥2级RE。≥2级RE发生组(n=91)与未发生组(n=185)患者肿瘤病灶长径(Z=-5.53,P<0.001)、Karnofsky功能状态(KPS)评分(χ^(2)=5.92,P=0.015)、美国东部肿瘤协作组(ECOG)评分(χ^(2)=4.01,P=0.045)、高血压(χ^(2)=15.35,P<0.001)、糖尿病(χ^(2)=13.06,P<0.001)、白细胞计数(Z=-6.59,P<0.001)、中性粒细胞计数(Z=-6.72,P<0.001)、放疗剂量(χ^(2)=9.81,P=0.002)差异均具有统计学意义。经过LASSO回归筛选最终选择出7个特征变量,分别为肿瘤病灶长径、ECOG评分、KPS评分、中性粒细胞计数、高血压、糖尿病、放疗剂量。ROC曲线分析显示,XGBoost模型预测性能较好,其AUC为0.90、准确度为0.82、精确度为0.80、敏感性为0.73、FI分数为0.76,RF模型AUC为0.89、准确度为0.78、精确度为0.76、敏感性为0.48、FI分数为0.59,DT模型AUC为0.72、准确度为0.72、精确度为0.44、敏感性为0.60、FI分数为0.52,SVM模型AUC为0.74、准确度为0.82、精确度为0.52、敏感性为0.88、FI分数为0.65。通过SHAP分析对XGBoost模型进行解释,其中肿瘤病灶长径、中性粒细胞计数、高血压、糖尿病、放疗剂量对食管癌患者CRT期间发生≥2级RE预测能力较强。结论基于XGBoost算法建立的模型对食管癌患者CRT期间发生≥2级RE具有较好的预测效能,同时与SHAP分析相结合,可以直观地了解模型中重要特征对结局的影响。 展开更多
关键词 食管肿瘤 化放疗 机器学习 放射性食管炎 shap分析
原文传递
基于多源数据的南京市公园降温效应研究 被引量:4
14
作者 朱云凤 王红 +2 位作者 覃书鸿 杨易 汪逸聪 《南京林业大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期285-294,共10页
【目的】利用拐点法量化公园的降温效应,并确定具有高效降温效应的公园面积和周长阈值范围,基于多源数据综合考虑城市公园的内部和外部特征对其降温效应的影响。【方法】基于2019年9月13日Landsat-8遥感影像,采用辐射传输法反演地表温度... 【目的】利用拐点法量化公园的降温效应,并确定具有高效降温效应的公园面积和周长阈值范围,基于多源数据综合考虑城市公园的内部和外部特征对其降温效应的影响。【方法】基于2019年9月13日Landsat-8遥感影像,采用辐射传输法反演地表温度;基于高分二号遥感影像,采用随机森林法进行土地覆被分类;基于百度地图兴趣面(area of interest,AOI)获取83个公园边界。利用拐点法得到公园的降温强度和降温距离,利用相关性分析和SHAP分析,从公园内景观特征、公园内环境特征和公园外环境特征3个方面探讨影响因子与公园降温效应之间的关系。【结果】(1)公园的降温面积阈值为18~19 hm^(2),周长阈值在1.9~2.0 km。(2)公园内部的建设用地高占比和较高的斑块密度会削弱公园降温效应,而水体和绿地的占比则可增强公园降温效应;面积加权周长比越小的公园越有助于公园降温效应的发挥。(3)公园内植被结构参数和生理特征对降温效应有显著影响,植被冠层越高、长势越好,降温距离越远;土壤含水量对降温效应至关重要。(4)公园外部较高的建筑高度和高道路密度会削弱公园降温效应。【结论】公园的降温效应受到公园内外景观特征和环境特征的影响。可以通过提高公园景观的完整性、合理配置绿地水体和培育优质植被等措施来改善公园降温效应,从而缓解城市热岛效应。 展开更多
关键词 城市公园 城市热岛 冷岛效应 多源数据 拐点法 shap分析 南京
原文传递
居民公募基金投资意愿与选择的影响因素分析
15
作者 陈然 《经济研究导刊》 2023年第21期96-99,共4页
通过文献分析,选出若干因子并分为四大类,分别是基金性质、基金绩效、投资能力、人际环境,基于此设计问卷。通过频数分析、信效度分析、lightGBM模型的拟合、SHAP算法的特征重要性分析发现,投资能力对于投资者选择投资公募基金至关重要... 通过文献分析,选出若干因子并分为四大类,分别是基金性质、基金绩效、投资能力、人际环境,基于此设计问卷。通过频数分析、信效度分析、lightGBM模型的拟合、SHAP算法的特征重要性分析发现,投资能力对于投资者选择投资公募基金至关重要。对于基金性质与基金业绩方面,投资者看重基金的稳健性及流动性等,同时希望基金经理的经验及能力越高越好。而人际环境方面的影响不大。正所谓认知影响行为,居民投资能力很大程度上决定了其投资意愿。因此,对于基金管理公司、基金代销公司和监管机构而言,可重点做好投资者教育,加大金融教育的力度。 展开更多
关键词 公募基金 居民投资意愿 影响因素 lightGBM模型的拟合 shap算法的特征重要性分析
在线阅读 下载PDF
基于机器学习的短程硝化/短程反硝化-厌氧氨氧化工艺脱氮性能预测与关键参数识别
16
作者 吴宇伦 李泽敏 +2 位作者 成晓倩 邱光磊 韦朝海 《环境工程》 CAS CSCD 2024年第9期180-190,共11页
短程硝化-厌氧氨氧化(PNA)与短程反硝化-厌氧氨氧化(PDA)工艺的脱氮性能会受到许多参数的影响。在综合考虑各种参数的基础上,对2种工艺的脱氮性能进行预测,并识别关键参数,能够为其实际工程应用提供优化目标。解决上述问题时,实验方法... 短程硝化-厌氧氨氧化(PNA)与短程反硝化-厌氧氨氧化(PDA)工艺的脱氮性能会受到许多参数的影响。在综合考虑各种参数的基础上,对2种工艺的脱氮性能进行预测,并识别关键参数,能够为其实际工程应用提供优化目标。解决上述问题时,实验方法耗时耗力,而传统数学模型难以处理非线性关系。因此采用机器学习技术,构建的随机森林(RF)机器学习模型对2个工艺的出水总氮(TN)浓度进行了高精度预测,对PNA和PDA工艺出水TN浓度预测结果的决定系数(R^(2))分别为0.728、0.812。SHAP方法能够较好地解释模型的预测过程,并对各参数进行了重要性排序。在PNA工艺中,出水TN浓度主要受到进水TN浓度及COD浓度的影响。在PDA工艺中,出水TN浓度首先受进水TN浓度及氮负荷的约束。在此基础上,进水COD浓度作为另一重要因素影响着工艺的出水TN浓度。进水COD浓度在2个工艺中的共同重要性表明,2种工艺在实际应用时需要预先做好污废水中碳源的管理与分配,预分离与应用策略非常重要。该研究采用机器学习模型为PNA与PDA工艺脱氮性能的预测提供了方法指导,并基于SHAP的模型解释为2种工艺在实际应用时的关键参数识别与优化提供了选择依据。 展开更多
关键词 短程硝化-厌氧氨氧化 短程反硝化-厌氧氨氧化 机器学习 shap分析 工艺参数
原文传递
改进的XGBoost杂散电流预测及可解释模型 被引量:5
17
作者 孟昭亮 张泽涛 +3 位作者 杨媛 李国锋 陶崇勃 牛一疆 《激光与光电子学进展》 CSCD 北大核心 2022年第12期336-342,共7页
为了解决影响地铁轨道的杂散电流特征众多,常规特征选择方法影响模型预测精度及模型结果可解释性差的问题,提出基于最优特征改进极端梯度提升(XGBoost)的杂散电流预测模型。利用遗传算法的灵活性和较强的搜索能力,在包含原始V个特征的... 为了解决影响地铁轨道的杂散电流特征众多,常规特征选择方法影响模型预测精度及模型结果可解释性差的问题,提出基于最优特征改进极端梯度提升(XGBoost)的杂散电流预测模型。利用遗传算法的灵活性和较强的搜索能力,在包含原始V个特征的集合中逐代寻找使目标函数均方误差(MSE)最小的前M个特征,建立最优特征选取方法下的杂散电流预测模型(OFS-XGBoost)。同时为了解决OFS-XGBoost模型预测结果较好,但是黑箱模型对预测结果解释性不足的问题,提出基于SHAP理论的归因分析框架,根据杂散电流特征样本的边际贡献,以易于理解的的方式显示特征集合对模型预测结果的影响,提高模型可解释性。结果表明:所提模型的预测误差仅为1.684%,低于相同优化策略下的随机森林、反向传播(BP)神经网络等预测模型;基于SHAP值的归因分析方法可以从全局与个体角度解释输入特征对杂散电流预测结果的影响,在提高模型可解释性的基础上辅助地铁智能化健康管理。 展开更多
关键词 极端梯度提升 特征选择 遗传算法 杂散电流 shap分析
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部