期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于MapReduce的朴素贝叶斯算法文本分类方法 被引量:7
1
作者 张晨跃 刘黎志 +1 位作者 邓开巍 刘杰 《武汉工程大学学报》 CAS 2021年第1期102-105,共4页
为了解决传统串行朴素贝叶斯算法分类性能低下的问题,提出一种基于朴素贝叶斯算法的并行化分类方法。选取多项式朴素贝叶斯,搭建Hadoop集群,通过卡方检验选取特征词,利用词频-逆文本频率指数方法计算出每个特征项的权值,并求出每类的权... 为了解决传统串行朴素贝叶斯算法分类性能低下的问题,提出一种基于朴素贝叶斯算法的并行化分类方法。选取多项式朴素贝叶斯,搭建Hadoop集群,通过卡方检验选取特征词,利用词频-逆文本频率指数方法计算出每个特征项的权值,并求出每类的权重总和,将权值应用到朴素贝叶斯公式中得到分类结果。实验结果表明:在该集群上设计的并行化朴素贝叶斯分类方法较比传统朴素贝叶斯方法,其精确率,召回率,F1值分别至少提高了7.66%,7.56%,11.98%,且用时更短,说明本文的方法能够提高处理文本的时间效率。 展开更多
关键词 朴素贝叶斯 分类 并行化 MAPREDUCE
在线阅读 下载PDF
基于Hive的空气质量大数据查询优化方法 被引量:1
2
作者 彭贝 刘黎志 +1 位作者 杨敏 张晨跃 《武汉工程大学学报》 CAS 2020年第4期467-472,共6页
为了提高对环境空气质量监测系统中省级环境监测中心站里已汇集的海量监测数据的统计和分析效率,提出了一种基于Spark集群在Hive上进行多维数据分区的查询优化方法。以湖北省环境监测中心站中的空气质量监测数据为研究对象,将数据转移到... 为了提高对环境空气质量监测系统中省级环境监测中心站里已汇集的海量监测数据的统计和分析效率,提出了一种基于Spark集群在Hive上进行多维数据分区的查询优化方法。以湖北省环境监测中心站中的空气质量监测数据为研究对象,将数据转移到Spark集群利用Spark SQL连接Hive并进行分区存储。设计了12种查询,查询4个数据集,通过与采用传统查询方法的实验对比得出结论。实验结果表明:基于Hive的分区优化方法对空气质量大数据的查询时间有47%到96%的优化,而随着查询的复杂程度和数据量的增加,该方法的优化效果越明显。 展开更多
关键词 SPARK Hive 空气质量 大数据 查询优化
在线阅读 下载PDF
弱连接社交媒体可供性与青年群体的持续使用意愿--线上社会资本与感知价值的链式中介效应 被引量:12
3
作者 杨雅 张晨跃 《学术探索》 CSSCI 2023年第7期49-57,共9页
当前弱连接社交媒体已经成为一种新兴媒介。研究用户对弱连接社交媒体产生接触的机制以及持续使用的意愿,在深度媒介化时代具有重要的价值。本研究以可供性理论作为基础,以弱连接社交媒体Tape提问箱作为研究对象,通过问卷调查法以及结... 当前弱连接社交媒体已经成为一种新兴媒介。研究用户对弱连接社交媒体产生接触的机制以及持续使用的意愿,在深度媒介化时代具有重要的价值。本研究以可供性理论作为基础,以弱连接社交媒体Tape提问箱作为研究对象,通过问卷调查法以及结构方程模型分析青年群体样本。结果表明,线上社会资本与感知价值在弱连接社交媒体可供性与持续使用意愿之间起链式中介作用;同时,匿名可供性对于桥接型和粘连型两类线上社会资本均有显著的正向预测作用。因此,弱连接社交媒体满足了用户预期,成为青年人舒缓媒介社交压力、寻求他人理解和认同的情感场域。 展开更多
关键词 可供性 弱连接社交媒体 持续使用意愿 线上社会资本 感知价值
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部