期刊文献+
共找到277篇文章
< 1 2 14 >
每页显示 20 50 100
Prediction of sandstone porosity in coal seam roof based on variable mode decomposition and random forest method
1
作者 Huang Ya-ping Qi Xue-mei +3 位作者 Cheng Yan Zhou Ling-ling Yan Jia-hao Huang Fan-rui 《Applied Geophysics》 2025年第1期197-208,235,236,共14页
Evaluation of water richness in sandstone is an important research topic in the prevention and control of mine water disasters,and the water richness in sandstone is closely related to its porosity.The refl ection sei... Evaluation of water richness in sandstone is an important research topic in the prevention and control of mine water disasters,and the water richness in sandstone is closely related to its porosity.The refl ection seismic exploration data have high-density spatial sampling information,which provides an important data basis for the prediction of sandstone porosity in coal seam roofs by using refl ection seismic data.First,the basic principles of the variational mode decomposition(VMD)method and the random forest method are introduced.Then,the geological model of coal seam roof sandstone is constructed,seismic forward modeling is conducted,and random noise is added.The decomposition eff ects of the empirical mode decomposition(EMD)method and VMD method on noisy signals are compared and analyzed.The test results show that the fi rstorder intrinsic mode functions(IMF1)and IMF2 decomposed by the VMD method contain the main eff ective components of seismic signals.A prediction process of sandstone porosity in coal seam roofs based on the combination of VMD and random forest method is proposed.The feasibility and eff ectiveness of the method are verifi ed by trial calculation in the porosity prediction of model data.Taking the actual coalfi eld refl ection seismic data as an example,the sandstone porosity of the 8 coal seam roof is predicted.The application results show the potential application value of the new porosity prediction method proposed in this study.This method has important theoretical guiding signifi cance for evaluating water richness in coal seam roof sandstone and the prevention and control of mine water disasters. 展开更多
关键词 VMD random forest method coal seams SANDSTONE POROSITY
在线阅读 下载PDF
Modeling habitat suitability of range plant species using random forest method in arid mountainous rangelands 被引量:8
2
作者 Hossein PIRI SAHRAGARD Majid AJORLO Peyman KARAMI 《Journal of Mountain Science》 SCIE CSCD 2018年第10期2159-2171,共13页
Mountainous rangelands play a pivotal role in providing forage resources for livestock, particularly in summer, and maintaining ecological balance. This study aimed to identify environmental variables affecting range ... Mountainous rangelands play a pivotal role in providing forage resources for livestock, particularly in summer, and maintaining ecological balance. This study aimed to identify environmental variables affecting range plant species distribution, ecological analysis of the relationship between these variables and the distribution of plants, and to model and map the plant habitats suitability by the Random Forest Method(RFM) in rangelands of the Taftan Mountain, Sistan and Baluchestan Province, southeastern Iran. In order to determine the environmental variables and estimate the potential distribution of plant species, the presence points of plants were recorded by using systematic random sampling method(90 points of presence) and soils were sampled in 5 habitats by random method in 0–30 and 30–60 cm depths. The layers of environmental variables were prepared using the Kriging interpolation method and Geographic Information System facilities. The distribution of the plant habitats was finally modelled and mapped by the RFM. Continuous maps of the habitat suitability were converted to binary maps using Youden Index(?) in order to evaluate the accuracy of the RFM in estimation of the distribution of species potentialhabitat. Based on the values of the area under curve(AUC) statistics, accuracy of predictive models of all habitats was in good level. Investigating the agreement between the predicted map, generated by each model, and actual maps, generated from fieldmeasured data, of the plant habitats, was at a high level for all habitats, except for Amygdalus scoparia habitat. This study concluded that the RFM is a robust model to analyze the relationships between the distribution of plant species and environmental variables as well as to prepare potential distribution maps of plant habitats that are of higher priority for conservation on the local scale in arid mountainous rangelands. 展开更多
关键词 Environmental (predictor) variables Habitat mapping Habitat distribution random forest method Tartan Mountain
在线阅读 下载PDF
A Data-Driven Car-Following Model Based on the Random Forest
3
作者 Huili Shi Tingli Wang +3 位作者 Fusheng Zhong Hanqing Wang Junyan Han Xiaoyuan Wang 《World Journal of Engineering and Technology》 2021年第3期503-515,共13页
The car-following models are the research basis of traffic flow theory and microscopic traffic simulation. Among the previous work, the theory-driven models are dominant, while the data-driven ones are relatively rare... The car-following models are the research basis of traffic flow theory and microscopic traffic simulation. Among the previous work, the theory-driven models are dominant, while the data-driven ones are relatively rare. In recent years, the related technologies of Intelligent Transportation System (ITS) re</span><span style="font-family:Verdana;">- </span><span style="font-family:Verdana;">presented by the Vehicles to Everything (V2X) technology have been developing rapidly. Utilizing the related technologies of ITS, the large-scale vehicle microscopic trajectory data with high quality can be acquired, which provides the research foundation for modeling the car-following behavior based on the data-driven methods. According to this point, a data-driven car-following model based on the Random Forest (RF) method was constructed in this work, and the Next Generation Simulation (NGSIM) dataset was used to calibrate and train the constructed model. The Artificial Neural Network (ANN) model, GM model, and Full Velocity Difference (FVD) model are em</span><span style="font-family:Verdana;">- </span><span style="font-family:Verdana;">ployed to comparatively verify the proposed model. The research results suggest that the model proposed in this work can accurately describe the car-</span><span style="font-family:Verdana;"> </span><span style="font-family:Verdana;">following behavior with better performance under multiple performance indicators. 展开更多
关键词 Traffic Flow Car-Following Model Data-Driven method random forest Intelligent Transportation System
在线阅读 下载PDF
Exploration of the Impact Mechanism of Government Credibility Based on Variable Screening Method
4
作者 Jiajun Wu Yuxiang Ma +2 位作者 Helin Zou Chun Zhang Ran Yan 《Journal of Data Analysis and Information Processing》 2024年第3期479-494,共16页
Government credibility is an important asset of contemporary national governance, an important criterion for evaluating government legitimacy, and a key factor in measuring the effectiveness of government governance. ... Government credibility is an important asset of contemporary national governance, an important criterion for evaluating government legitimacy, and a key factor in measuring the effectiveness of government governance. In recent years, researchers’ research on government credibility has mostly focused on exploring theories and mechanisms, with little empirical research on this topic. This article intends to apply variable selection models in the field of social statistics to the issue of government credibility, in order to achieve empirical research on government credibility and explore its core influencing factors from a statistical perspective. Specifically, this article intends to use four regression-analysis-based methods and three random-forest-based methods to study the influencing factors of government credibility in various provinces in China, and compare the performance of these seven variable selection methods in different dimensions. The research results show that there are certain differences in simplicity, accuracy, and variable importance ranking among different variable selection methods, which present different importance in the study of government credibility issues. This study provides a methodological reference for variable selection models in the field of social science research, and also offers a multidimensional comparative perspective for analyzing the influencing factors of government credibility. 展开更多
关键词 Government Credibility Variable Selection Models Social Statistics Regression Based Approach method Based on random forest
在线阅读 下载PDF
Estimation of wear performance of AZ91 alloy under dry sliding conditions using machine learning methods 被引量:4
5
作者 Fatih AYDIN Rafet DURGUT 《Transactions of Nonferrous Metals Society of China》 SCIE EI CAS CSCD 2021年第1期125-137,共13页
The wear behavior of AZ91 alloy was investigated by considering different parameters,such as load(10−50 N),sliding speed(160−220 mm/s)and sliding distance(250−1000 m).It was found that wear volume loss increased as lo... The wear behavior of AZ91 alloy was investigated by considering different parameters,such as load(10−50 N),sliding speed(160−220 mm/s)and sliding distance(250−1000 m).It was found that wear volume loss increased as load increased for all sliding distances and some sliding speeds.For sliding speed of 220 mm/s and sliding distance of 1000 m,the wear volume losses under loads of 10,20,30,40 and 50 N were calculated to be 15.0,19.0,24.3,33.9 and 37.4 mm3,respectively.Worn surfaces show that abrasion and oxidation were present at a load of 10 N,which changes into delamination at a load of 50 N.ANOVA results show that the contributions of load,sliding distance and sliding speed were 12.99%,83.04%and 3.97%,respectively.The artificial neural networks(ANN),support vector regressor(SVR)and random forest(RF)methods were applied for the prediction of wear volume loss of AZ91 alloy.The correlation coefficient(R2)values of SVR,RF and ANN for the test were 0.9245,0.9800 and 0.9845,respectively.Thus,the ANN model has promising results for the prediction of wear performance of AZ91 alloy. 展开更多
关键词 AZ91 alloy wear performance artificial neural networks support vector regressor random forest method
在线阅读 下载PDF
基于随机森林算法的巩义市地质环境承载力评价
6
作者 包峻帆 陈婕 +8 位作者 杨文涛 杨泽强 侯文青 陈恪 袁野 杨明权 景斐媛 刘哲 张媛媛 《人民黄河》 北大核心 2025年第1期110-117,共8页
以黄河中下游典型地质环境脆弱区河南巩义市为例,综合运用遥感地表形变监测技术、随机森林方法、GIS技术等,选取涵盖地貌环境、地质环境、生态环境和社会环境4个方面的共20个评价指标,建立了研究区地质环境承载力评价指标体系,采用层次... 以黄河中下游典型地质环境脆弱区河南巩义市为例,综合运用遥感地表形变监测技术、随机森林方法、GIS技术等,选取涵盖地貌环境、地质环境、生态环境和社会环境4个方面的共20个评价指标,建立了研究区地质环境承载力评价指标体系,采用层次分析和变异系数(AHP-CV)组合赋权法和随机森林算法确定各评价指标权重,结合GIS空间分析功能,对巩义市地质环境承载力进行了评价,并基于地质灾害隐患点和地质灾害风险等级对地质环境承载力评价结果进行了优化。结果表明:AHP-CV组合赋权法和随机森林算法计算的地质环境承载力评价结果基本吻合,随机森林算法提高了地质环境承载力评价的可靠性,预测结果科学性、准确性更强,能够更好适用于地质环境承载力评价;基于地质灾害隐患点和地质灾害风险等级的优化评价结果,能够有效提高评价结果的精确性;地质灾害风险区划、工程地质岩组、黄土湿陷性和矿区破坏程度是影响研究区地质环境承载力提升的主要障碍因子。巩义市东部和南部受采矿活动影响,地质灾害频发,地质环境承载力等级为差,建议及时开展矿山生态修复和地质灾害防控治理;东北部及西北部受地质灾害和黄土湿陷性制约,地质环境承载力等级为较差,建议采取水土流失防治措施等。 展开更多
关键词 地质环境承载力 随机森林算法 组合赋权法 黄河中下游 巩义市
在线阅读 下载PDF
基于PIE-Engine平台的矿区受损区域识别研究
7
作者 熊金婷 侯湖平 +1 位作者 张绍良 李耀 《测绘与空间地理信息》 2025年第1期28-32,36,共6页
基于PIE-Engine平台提出了Otsu全局阈值法、简单线段集合局部阈值法和多特征指数的随机森林分类法3种矿区受损区域的识别方法,并且对比分析3种识别方法的适用性,以锡林郭勒盟的3个矿区为例,利用Landsat 8影像数据开展实证研究。结果显... 基于PIE-Engine平台提出了Otsu全局阈值法、简单线段集合局部阈值法和多特征指数的随机森林分类法3种矿区受损区域的识别方法,并且对比分析3种识别方法的适用性,以锡林郭勒盟的3个矿区为例,利用Landsat 8影像数据开展实证研究。结果显示:3种识别方法都具有精度高、速度快的特点;其中,基于多特征指数的随机森林分类法的适用性最强;研究区内受损区域自开采以来整体呈现增加趋势,受损区域与开采项目周期之间有周期性波动的特点。综上所述,利用PIE-Engine平台采用3种识别方法可提高处理数据的效率、识别速度和识别精准度,可用于政府部门对矿山越界开采、无序开采的监测和管理。 展开更多
关键词 受损区域识别 Otsu全局阈值法 局部阈值法 随机森林法 PIE-Engine
在线阅读 下载PDF
珠江三角洲地区用水量影响要素及其关联规则
8
作者 郑炎辉 徐小迪 +2 位作者 李俊辉 林树彦 何艳虎 《中山大学学报(自然科学版)(中英文)》 北大核心 2025年第2期22-32,共11页
区域用水量影响要素及其关联规则识别对于合理预测用水需求和优化配置水资源具有重要意义。本文基于珠三角地区历年水资源开发利用数据和经济社会发展统计数据,利用随机森林(RF,random forest)和人工神经网络(ANN,artificial neural net... 区域用水量影响要素及其关联规则识别对于合理预测用水需求和优化配置水资源具有重要意义。本文基于珠三角地区历年水资源开发利用数据和经济社会发展统计数据,利用随机森林(RF,random forest)和人工神经网络(ANN,artificial neural network)两种机器学习模型,并综合采用SHAP(shapley additive explanations)和部分依赖图(PDP,partial dependence plots)方法,系统识别了珠三角地区用水量影响要素及其与用水量的关联规则,揭示了各影响要素贡献度的时空变化特征。结果表明:用水量影响要素按重要度排序依次是GDP、人口规模、耕地面积、人均水资源量、农田实灌单位面积平均用水量、城镇人均生活用水量;ANN模型和RF模型决定系数平均值分别在0.94和0.92以上;用水量影响要素空间上呈现中心城市以人口为主导、周边地区以耕地面积为主导的特点;珠三角地区用水量对于人口规模和耕地面积变化的响应最为明显。研究可为珠三角地区未来用水需求预测以及水资源空间均衡配置提供科学依据与技术支撑。 展开更多
关键词 人工神经网络 随机森林 用水量 SHAP方法 PDP
在线阅读 下载PDF
自然灾害频发性评价及其对地区供水能力影响力研究:基于随机森林赋权-TOPSIS法
9
作者 樊艳翔 雷社平 解建仓 《城市地质》 2025年第1期70-80,共11页
使用2008—2020年相关省级面板数据,采用随机森林赋权—TOPSIS法对地区自然灾害频发性进行了评价,在此基础上使用Tobit回归模型分析了自然灾害频发性对地区供水能力的影响方向,并进一步使用灰色关联法探究了自然灾害频发性对地区供水能... 使用2008—2020年相关省级面板数据,采用随机森林赋权—TOPSIS法对地区自然灾害频发性进行了评价,在此基础上使用Tobit回归模型分析了自然灾害频发性对地区供水能力的影响方向,并进一步使用灰色关联法探究了自然灾害频发性对地区供水能力的影响力。研究发现:1)地区之间自然灾害频发性差异性分布明显,整体而言可以分为4个层级:第一级为新疆、内蒙古、四川;第二级为山东、广东、辽宁、黑龙江、河南、陕西、云南;第三级所包含行政区众多,自然灾害频发性测算值总体维持在0.25左右;第四级主要集中在东部地区。2)就空间分布来看,自然灾害频发性整体呈现由东部向西部地区逐渐增强的演变态势,整体呈现西高东低、北高南低的分布格局。3)自然灾害频发性与地区供水能力存在显著的负相关关系,在此基础上通过Tobit模型验证了地区自然灾害频发性对供水能力有着显著的负面影响。4)就影响力来看,除宁夏以外,中国各地区自然灾害频发性对供水能力的负面影响力度均较强。 展开更多
关键词 自然灾害频发性 供水能力 影响力 随机森林赋权 TOPSIS法
在线阅读 下载PDF
基于测井曲线深程度耦合的页岩岩相智能识别方法
10
作者 刘粤蛟 赖富强 +4 位作者 徐浩 王濡岳 张晓树 罗彤彤 杨彬跃 《地质科技通报》 北大核心 2025年第1期308-320,共13页
四川盆地渝西区块五峰组-龙马溪组是国内典型的页岩气储层,其层间强非均质性,导致采集的测井曲线信息存在大量冗余且曲线间耦合关系复杂,岩相测井识别难度高、精度低,亟需技术方法创新。本文在岩相划分与分析的基础上,联合主成分分析法... 四川盆地渝西区块五峰组-龙马溪组是国内典型的页岩气储层,其层间强非均质性,导致采集的测井曲线信息存在大量冗余且曲线间耦合关系复杂,岩相测井识别难度高、精度低,亟需技术方法创新。本文在岩相划分与分析的基础上,联合主成分分析法与随机森林算法构建了一种岩相智能识别方法。研究结果表明:①利用主成分分析法对测井曲线进行优化,可以使测井曲线深度耦合,削减测井信息冗余及曲线间复杂耦合关系等因素对岩相识别的影响,可得到更加科学有效的数据信息;②向原始数据添加不改变其岩相的微量变化,可以达到数据增强的效果,在一定程度上解决随机森林算法由于数据集比较小或者不平衡时,模型的泛化能力和稳定性差的问题;③联合主成分分析法与随机森林算法构建的岩相智能识别方法运用识别准确率达83%以上,适用性强,准确率高。该方法不仅在一定程度上克服了研究区岩相识别困难的问题,也极大地提高了岩相识别效率,对促进研究区页岩气经济高效开发具有重要意义。 展开更多
关键词 渝西区块 岩相识别 测井曲线深程度耦合 主成分分析法 随机森林算法 页岩
在线阅读 下载PDF
基于机器学习的女性压力性尿失禁发病风险预测模型建立及效能评价
11
作者 时欣然 庞震 +2 位作者 乔婷 李晶晶 王勤章 《现代泌尿外科杂志》 2025年第3期196-206,共11页
目的运用K最近邻法(KNN)、支持向量机(SVM)、决策树(DT)及随机森林(RF)构建女性压力性尿失禁(SUI)发病的预测模型,并评估各模型效能,为SUI的早期诊断提供参考。方法回顾性分析2019年10月—2023年10月石河子大学第一附属医院泌尿外科及... 目的运用K最近邻法(KNN)、支持向量机(SVM)、决策树(DT)及随机森林(RF)构建女性压力性尿失禁(SUI)发病的预测模型,并评估各模型效能,为SUI的早期诊断提供参考。方法回顾性分析2019年10月—2023年10月石河子大学第一附属医院泌尿外科及妇产科治疗的女性SUI患者及同期行健康查体女性的临床资料,将产后42 d女性纳入产后组(n=611),围绝经期与绝经后女性纳入非产后组(n=409)。设置随机种子数并以7∶3的比例分为训练集与验证集。收集所有研究对象的相关临床资料,使用单因素及Lasso回归筛选有意义的变量,将其纳入KNN、SVM、DT及RF算法中并构建模型,分别计算模型的敏感度、特异度、准确度、曲线下面积(AUC)等,筛选出最优的模型。结果产后组SUI患者为352例,占57.6%。根据单因素及Lasso回归,产后组筛选出有意义的变量为:年龄、身体质量指数(BMI)、快肌阶段最大值、孕次、膀胱颈移动度(BND)、尿道旋转角(URA)、会阴侧切、既往尿失禁史及便秘。在产后组验证集中KNN、SVM、DT、RF模型的AUC分别为0.881、0.878、0.750、0.905,RF模型的AUC、准确度、F1指数及Kappa值均最大。非产后组SUI患者为260例,占63.6%。根据单因素及Lasso回归,非产后组筛选出有意义的变量为:年龄、BMI、快肌阶段最大值及恢复时间、慢肌阶段平均值、后静息阶段变异性、阴道分娩、既往尿失禁史及便秘。在非产后组验证集中KNN、SVM、DT、RF模型的AUC分别为0.819、0.805、0.603、0.830,RF模型的AUC、准确度、Kappa值均最大。结论本研究基于机器学习成功建立4种产后42 d女性,围绝经期及绝经后女性SUI发病的预测模型,其中采用RF算法的模型预测效率最佳。 展开更多
关键词 压力性尿失禁 预测模型 机器学习 决策树 随机森林 支持向量机 K最近邻法
在线阅读 下载PDF
基于交易采样子图的以太坊钓鱼检测方法
12
作者 雷帮春 孟坤 +1 位作者 宋登科 陈大兴 《计算机工程与设计》 北大核心 2025年第3期690-697,共8页
以太坊提供了图灵完备的去中心网络应用开发和部署环境,所充斥的钓鱼诈骗类应用已成为以太坊的最大安全威胁。为提高以太坊钓鱼检测的效率问题,提出一种基于交易采样子图网络的以太坊钓鱼检测方法。构建目标地址的原始交易子图;设计分... 以太坊提供了图灵完备的去中心网络应用开发和部署环境,所充斥的钓鱼诈骗类应用已成为以太坊的最大安全威胁。为提高以太坊钓鱼检测的效率问题,提出一种基于交易采样子图网络的以太坊钓鱼检测方法。构建目标地址的原始交易子图;设计分层网络采样方法和时序映射机制构建它的4种交易采样子图并提取图特征;利用去重特征融合来消除冗余,输出融合特征来训练随机森林分类器。实验验证了该方法的合理性和有效性,获得了较高的F1值。 展开更多
关键词 以太坊 钓鱼检测方法 交易采样子图网络 网络采样方法 图特征方法 去重特征融合 随机森林分类器
在线阅读 下载PDF
城市绿地公园可达性分析——以成都市中心城区为例
13
作者 陈润渲 刘刚 李典 《国土与自然资源研究》 2025年第3期40-44,共5页
随着公园城市的建设,绿地公园对城市可持续发展的促进作用越来越显著。城市居民也逐步将绿地公园作为休憩游玩的重要选择,绿地公园可达性是城市生活质量的一大衡量指标。为此,将以成都市中心五城区作为研究区域,研究其公园绿地空间分布... 随着公园城市的建设,绿地公园对城市可持续发展的促进作用越来越显著。城市居民也逐步将绿地公园作为休憩游玩的重要选择,绿地公园可达性是城市生活质量的一大衡量指标。为此,将以成都市中心五城区作为研究区域,研究其公园绿地空间分布情况以及居民日常出行情况。利用人口统计年鉴及多源遥感数据针对人口数据进行人口空间化,同时利用衰减函数的Ga2SFCA(高斯两步移动搜索法)进行成都市五城区绿地公园可达性分析。同时,对绿地空间可达性结果进行空间自相关分析,研究其空间分布格局。结果表明,成都市中心城区人口分布呈多中心多聚集的分布特征,绿地公园可达性呈四周可达性较高中心较低分布,且探索其人口空间分布与绿地可达性聚类模式,为未来绿地公园空间规划提供参考性意见。 展开更多
关键词 空间可达性 绿地公园 随机森林 人口空间化 高斯两步移动搜索法
在线阅读 下载PDF
基于ALOS-2 PALSAR-2双极化数据喀斯特山区水稻种植面积的提取研究
14
作者 谭攀攀 陈盼芳 +3 位作者 曾程瑶 赵伟丽 尹荣波 黄元佳 《贵州农业科学》 2025年第2期143-149,共7页
【目的】探究基于高精度雷达影像ALOS-2 PALSAR-2双极化数据水稻种植面积的提取方法,为快速、准确获取水稻种植信息提供参考。【方法】基于ALOS-2 PALSAR-2双极化数据的反向散射特征,采用最大似然法、支持向量机和随机森林分类3种方法... 【目的】探究基于高精度雷达影像ALOS-2 PALSAR-2双极化数据水稻种植面积的提取方法,为快速、准确获取水稻种植信息提供参考。【方法】基于ALOS-2 PALSAR-2双极化数据的反向散射特征,采用最大似然法、支持向量机和随机森林分类3种方法提取喀斯特山区的水稻种植面积,并对分类结果精度进行评估。【结果】采用随机森林分类提取水稻的总体分类精度、Kappa系数、制图精度及用户精度均达最高,分别为89.16%、0.85、90.00%及96.40%;提取水稻的种植面积为18.46 km^(2),与实际统计面积(16.38 km^(2))一致性达87.30%。【结论】基于ALOS-2 PALSAR-2双极化数据的随机森林分类可有效提升水稻种植信息的提取精度,较好地反映水稻的实际分布情况。 展开更多
关键词 水稻 ALOS-2 PALSAR-2 最大似然法 支持向量机 随机森林分类 喀斯特山区
在线阅读 下载PDF
深厚软土区桩柱式桥墩临界荷载简化计算方法 被引量:2
15
作者 刘晓明 李曦 +3 位作者 刘齐建 刘涛 殷悦 曾磊 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第3期92-98,共7页
现有桩柱式桥墩临界荷载简化计算方法在大多数情况下计算误差较大,适用性有限.在利用软土区现场桩基屈曲实验结果标定的基础上,采用基于特征值屈曲分析的有限元方法对有典型桩柱式桥墩的临界荷载进行了计算并与现有简化计算方法结果进... 现有桩柱式桥墩临界荷载简化计算方法在大多数情况下计算误差较大,适用性有限.在利用软土区现场桩基屈曲实验结果标定的基础上,采用基于特征值屈曲分析的有限元方法对有典型桩柱式桥墩的临界荷载进行了计算并与现有简化计算方法结果进行了对比,指出了现有简化计算方法的适用范围,发现现有简化方法不适用于软土区桩柱式桥墩计算.在大量桩柱式桥墩有限元特征值屈曲分析数据的基础上,采用随机森林算法对计算结果进行分析,得到可以计算桩柱式桥墩计算长度的随机森林模型以及各影响参数重要性指数分析结果.最后以现常用简化公式为基本形式,纳入随机森林算法给出的重要参数,通过回归分析,提出了深厚软土区桩柱式桥墩临界荷载的简化计算方法. 展开更多
关键词 桩柱式桥墩 临界荷载 有限元 随机森林
在线阅读 下载PDF
基于ADASYN和WGAN的混合不平衡数据处理方法 被引量:1
16
作者 周万珍 盛媛媛 +1 位作者 张永强 马金龙 《河北工业科技》 CAS 2024年第4期291-298,共8页
为了解决不平衡数据集中少数类样本分类精度较低的问题,提出了一种处理不平衡数据集的ADASYN-WGAN方法。首先,采用ADASYN(adaptive synthetic sampling)算法生成少数类样本,用这些生成样本代替WGAN(wasserstein generative adversarial ... 为了解决不平衡数据集中少数类样本分类精度较低的问题,提出了一种处理不平衡数据集的ADASYN-WGAN方法。首先,采用ADASYN(adaptive synthetic sampling)算法生成少数类样本,用这些生成样本代替WGAN(wasserstein generative adversarial networks)中的随机噪声;其次,利用WGAN算法生成符合原始数据集分布规律的少数类样本,构建平衡数据集;然后,在6个公开数据集上,采用随机森林分类器对所提方法和4种过采样算法得出的处理结果分别与原始数据集进行对比;最后,通过F1-Score,G-mean和AUC等分类评估指标的表现验证所提方法的有效性。结果表明:在对比实验中,经过ADASYN-WGAN方法得到的平衡数据集在随机森林分类器的十折交叉验证中,4个公开数据集中的各项分类评估指标值均达到最优,虽然另2个公开数据集中的AUC值略低,但其F1-Score和G-mean取得了最高值。所提出的ADASYN-WGAN方法可生成高质量的数据样本,并可为解决不平衡数据集中少数类样本的预测偏差问题提供参考。 展开更多
关键词 数据处理 不平衡数据 WGAN ADASYN 过采样方法 随机森林
在线阅读 下载PDF
基于随机森林和长短期记忆网络模型的高压气井环空带压预测方法 被引量:1
17
作者 张智 王翔辉 +1 位作者 黄媚 冯少波 《天然气工业》 EI CAS CSCD 北大核心 2024年第9期167-178,共12页
高压气井在生产过程中持续的环空带压容易引起套管柱变形或挤毁,是高压气井完整性失效的主要原因之一。为解决传统方法环空带压预测精度不高的问题,以鄂尔多斯盆地苏里格气田某高压气井为例,首先利用主成分分析法和相关系数法找到影响... 高压气井在生产过程中持续的环空带压容易引起套管柱变形或挤毁,是高压气井完整性失效的主要原因之一。为解决传统方法环空带压预测精度不高的问题,以鄂尔多斯盆地苏里格气田某高压气井为例,首先利用主成分分析法和相关系数法找到影响环空带压的主要因素,然后使用高压气井井筒温压场理论值和孤立森林模型对主成分进行物理解释和数据清洗,再对清洗后的数据使用随机森林(RF)和长短期记忆网络(LSTM)模型建立了环空带压定量预测模型,并对两类模型进行权重组合,最终建立了精确度高于任意单一模型的RF—LSTM组合环空带压预测新模型。研究结果表明:(1)环空带压的主要影响因子有温度分量、压力分量、产量分量、腐蚀程度、生产状态,而温度分量与环空带压间存在最高关联性;(2)通过错误格式、离群点及基于井筒温压场的数据清洗,可以得到数据清洗后的环空带压影响因素训练集;(3)通过平均绝对误差法(MAE)能够建立误差分数小于任意单一模型,而拟合优度介于两者之间的组合模型,因此可以将具有高拟合优度和低误差分数的两类模型结合,从而组合出同时满足两种分数的组合模型。结论认为:(1)运用大数据挖掘技术及算法进行环空带压定量预测,方法新颖,预测精度高,结果可行;(2)该方法为现场环空带压预测和风险管控提供了决策工具参考,为实现环空带压风险实时预测、预警和管控提供了理论支撑。 展开更多
关键词 环空带压 数据挖掘 随机森林 主成分分析 LSTM 大数据 预测方法
在线阅读 下载PDF
A Statistical Analysis of Textual E-Commerce Reviews Using Tree-Based Methods
18
作者 Jessica Kubrusly Ana Luiza Neves Thamires Louzada Marques 《Open Journal of Statistics》 2022年第3期357-372,共16页
With the increasing interest in e-commerce shopping, customer reviews have become one of the most important elements that determine customer satisfaction regarding products. This demonstrates the importance of working... With the increasing interest in e-commerce shopping, customer reviews have become one of the most important elements that determine customer satisfaction regarding products. This demonstrates the importance of working with Text Mining. This study is based on The Women’s Clothing E-Commerce Reviews database, which consists of reviews written by real customers. The aim of this paper is to conduct a Text Mining approach on a set of customer reviews. Each review was classified as either a positive or negative review by employing a classification method. Four tree-based methods were applied to solve the classification problem, namely Classification Tree, Random Forest, Gradient Boosting and XGBoost. The dataset was categorized into training and test sets. The results indicate that the Random Forest method displays an overfitting, XGBoost displays an overfitting if the number of trees is too high, Classification Tree is good at detecting negative reviews and bad at detecting positive reviews and the Gradient Boosting shows stable values and quality measures above 77% for the test dataset. A consensus between the applied methods is noted for important classification terms. 展开更多
关键词 Text Mining Supervised Classification Tree-Based methods Classification Trees random forest Gradient Boosting XGBoost
在线阅读 下载PDF
我国城市数字创业活跃度与外部驱动因素 被引量:2
19
作者 孙娜 杨世伟 陈文晖 《中国流通经济》 CSSCI 北大核心 2024年第3期23-32,共10页
数字创业是数字技术与数字经济发展的产物,是数字化赋能经济高质量发展的关键路径,客观认识数字创业现状、揭示其驱动因素是激发数字创业活力的前提。基于2006—2021年我国283个地级及以上城市(未含香港、澳门、台湾地区城市)信息传输... 数字创业是数字技术与数字经济发展的产物,是数字化赋能经济高质量发展的关键路径,客观认识数字创业现状、揭示其驱动因素是激发数字创业活力的前提。基于2006—2021年我国283个地级及以上城市(未含香港、澳门、台湾地区城市)信息传输、软件和信息技术服务业新注册企业数据,测算分析数字创业活跃度水平及其变化,进而利用随机森林模型估计数字创业活跃度多维外部驱动因素重要性。数字创业活跃度测算结果表明,我国城市数字创业活跃度水平呈先下降后上升的V字形变化趋势,主要城市数字创业活跃度水平明显高于其他城市,且两者的差距有扩大趋势。外部驱动因素分析结果表明,我国城市数字创业活跃度受技术环境、市场环境、经济环境、政策环境维度因素共同影响,其中产业发展基础、政府支持、技术累积量、市场化程度、产业结构是主要驱动因素;分阶段看,技术累积量和人力资本水平的驱动作用在增强,市场规模的驱动作用在减弱;分城市类型看,相比于主要城市,技术环境维度的科研投入强度、人力资本水平、融资条件,特别是市场环境维度的市场化程度对其他城市的驱动作用更强。为提升我国城市数字创业活跃度,应加强政策引导,加大保障力度,着力推动数字创业;健全要素市场运行机制,优化数字创业市场环境;围绕产业发展引进和培养人才,加强数字人才队伍建设;畅通创业融资渠道,缓解企业资金困境。 展开更多
关键词 数字经济 创业活跃度 外部驱动因素 重要性 随机森林模型
在线阅读 下载PDF
基于环境因子优化TSES法选择负样本及其在滑坡易发性评价中的应用 被引量:2
20
作者 崔玉龙 朱路路 +1 位作者 徐敏 缪海波 《地质科技通报》 CAS CSCD 北大核心 2024年第3期192-199,共8页
滑坡易发性评价是滑坡灾害防治的重要手段之一,而不合理的滑坡负样本会影响滑坡易发性评价,从而影响到滑坡灾害的防治,因此提供一种合理的负样本选取方法变得尤为关键。以西藏米林市的古滑坡为例,选择高程、坡度、坡向、坡位、距道路距... 滑坡易发性评价是滑坡灾害防治的重要手段之一,而不合理的滑坡负样本会影响滑坡易发性评价,从而影响到滑坡灾害的防治,因此提供一种合理的负样本选取方法变得尤为关键。以西藏米林市的古滑坡为例,选择高程、坡度、坡向、坡位、距道路距离、距断层距离、距水系距离、地形起伏度、地层岩性、土地利用类型10类环境因子,使用Relief算法计算环境因子的贡献值并依据贡献值优化选择环境因子;基于环境因子优化的目标空间外向化采样法(target space exteriorization sampling,简称TSES)选择负样本,作为性能优异的随机森林模型的输入变量;之后结合优化的环境因子和正或负样本预测米林市的滑坡易发性,并用混淆矩阵和ROC曲线评价构建模型的性能。为检验环境因子优化的TSES法的有效性和先进性,采用耦合信息量法和TSES法选择滑坡负样本并构建随机森林模型,与环境因子优化的TSES法构建的随机森林模型进行对比研究。结果表明,环境因子优化的TSES法构建的随机森林模型的评价效果较好,其ACC为93.7%、AUC为0.987,均高于耦合信息量、TSES法构成的模型。环境因子优化的TSES法能够提高模型的精度,解决多因子作为约束条件取样中因子选取的问题,为滑坡易发性评价采集负样本提供了新的思路。 展开更多
关键词 滑坡易发性评价 RELIEF算法 负样本 环境因子优化TSES法 随机森林 古滑坡
在线阅读 下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部