期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于细粒度代码表示和特征融合的即时软件缺陷预测方法
1
作者 朱晓燕 王文格 +1 位作者 王嘉寅 张选平 《计算机科学》 北大核心 2025年第1期242-249,共8页
即时软件缺陷预测指在软件更改初次提交之际预测该更改引入缺陷的倾向。此类预测针对单一程序变更,而非在粗粒度上进行。由于其即时性和可追溯性,该技术已在持续测试等领域得到广泛应用。目前的研究中,提取变更代码表示的方法粒度较粗,... 即时软件缺陷预测指在软件更改初次提交之际预测该更改引入缺陷的倾向。此类预测针对单一程序变更,而非在粗粒度上进行。由于其即时性和可追溯性,该技术已在持续测试等领域得到广泛应用。目前的研究中,提取变更代码表示的方法粒度较粗,仅标出了变更行,而没有进行细粒度的标记。此外,现有的使用提交内容进行缺陷预测的方法,仅仅是把提交消息与变更代码的特征进行简单拼接,缺失了在特征空间上的深度对齐,这使得在提交消息质量参差不齐的情况下,会出现预测结果易受噪声干扰的情形,并且现有方法也未将领域专家设计的人工特征以及变更内容中的语义语法信息综合起来进行预测。为了解决上述问题,提出了一种基于细粒度代码表征和特征融合的即时软件缺陷预测方法。通过引入新的变更嵌入计算方法来在细粒度上表示变更代码。同时,引入特征对齐模块,降低提交消息中噪声对方法性能的影响。此外,使用神经网络从人工设计的特征中学习专业知识,充分利用现有特征进行预测。实验结果表明,相较于现有方法,该方法在3个性能指标上均有显著提升。 展开更多
关键词 即时软件缺陷预测 特征融合 软件工程 深度学习 代码表示
在线阅读 下载PDF
基于知识回放的即时软件缺陷预测增量模型
2
作者 张文静 李勇 王越 《计算机应用研究》 CSCD 北大核心 2024年第11期3420-3425,共6页
即时软件缺陷预测技术可以实现细粒度代码变更的即时缺陷预测,对于提高软件代码质量和保证软件可靠性具有重要意义。传统静态软件缺陷预测模型在处理即时软件数据流时会存在“知识遗忘”的情况,从而导致模型泛化性能较差的问题。为此,... 即时软件缺陷预测技术可以实现细粒度代码变更的即时缺陷预测,对于提高软件代码质量和保证软件可靠性具有重要意义。传统静态软件缺陷预测模型在处理即时软件数据流时会存在“知识遗忘”的情况,从而导致模型泛化性能较差的问题。为此,提出一种基于知识回放的即时软件缺陷预测增量模型方法。首先,通过知识回放机制存储模型参数和随机样本,实现对旧知识的学习;其次,使用分布式训练框架在本地设备上对即时软件数据流进行增量学习,通过重构实现模型的即时更新;最后采用知识蒸馏技术,构建全局增量预测模型。实验表明,该模型与常见模型算法相比,在保证训练效率的前提下,模型的综合性能表现较优。 展开更多
关键词 即时软件缺陷预测 增量学习 知识回放 知识蒸馏
在线阅读 下载PDF
基于数据集扩充的即时软件缺陷预测方法
3
作者 杨帆 夏鸿崚 《南通大学学报(自然科学版)》 CAS 2024年第1期58-65,共8页
即时软件缺陷预测针对项目开发与维护过程中的代码提交来预测是否会引入缺陷。在即时软件缺陷预测研究领域,模型训练依赖于高质量的数据集,然而已有的即时软件缺陷预测方法尚未研究数据集扩充方法对即时软件缺陷预测的影响。为提高即时... 即时软件缺陷预测针对项目开发与维护过程中的代码提交来预测是否会引入缺陷。在即时软件缺陷预测研究领域,模型训练依赖于高质量的数据集,然而已有的即时软件缺陷预测方法尚未研究数据集扩充方法对即时软件缺陷预测的影响。为提高即时软件缺陷预测的性能,提出一种基于数据集扩充的即时软件缺陷预测(prediction based on data augmentation,PDA)方法。PDA方法包括特征拼接、样本生成、样本过滤和采样处理4个部分。增强后的数据集样本数量充足、样本质量高且消除了类不平衡问题。将提出的PDA方法与最新的即时软件缺陷预测方法(JIT-Fine)作对比,结果表明:在JIT-Defects4J数据集上,F_(1)指标提升了18.33%;在LLTC4J数据集上,F_(1)指标仍有3.67%的提升,验证了PDA的泛化能力。消融实验证明了所提方法的性能提升主要来源于数据集扩充和筛选机制。 展开更多
关键词 数据增强 深度学习 即时软件缺陷预测 样本生成 类不平衡问题
在线阅读 下载PDF
一种即时软件缺陷预测模型及其可解释性研究 被引量:3
4
作者 陈丽琼 王璨 宋士龙 《小型微型计算机系统》 CSCD 北大核心 2022年第4期865-871,共7页
即时软件缺陷预测是保障软件安全与质量相统一的必要途径,在软件工程领域受到越来越多的关注.然而,现有数据集存在特征冗余和特征相关性低的情况,极大影响了即时软件缺陷预测模型的分类性能和稳定性.此外,分析缺陷数据特征对模型的影响... 即时软件缺陷预测是保障软件安全与质量相统一的必要途径,在软件工程领域受到越来越多的关注.然而,现有数据集存在特征冗余和特征相关性低的情况,极大影响了即时软件缺陷预测模型的分类性能和稳定性.此外,分析缺陷数据特征对模型的影响尤为重要,但如今对软件缺陷预测模型进行解释性研究较少.针对这些问题,文章基于6个开源项目的227417个代码级变更的大规模实证研究,创新性地选择了SHAP+SMOTEENN+XGBoost(SHAP-SEBoost)构建即时软件缺陷预测模型.首先通过SHAP(SHapley Additive exPlanation)模型可解释器分析初始数据集特征,并根据分析结果对数据集进行相应的特征选择与组合.然后,利用SMOTEENN对类不平衡的缺陷数据进行正负样本均衡化,使用集成学习算法XGBoost对实验数据进行预测建模.最后,使用SHAP对本文模型进行可解释性分析.实验结果表明SHAP-SEBoost有效地提高了分类性能,与基线模型以及近年优秀模型相比AUC平均提高11.6%,F1平均提升33.5%. 展开更多
关键词 即时软件缺陷预测 模型可解释性 特征工程 集成学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部