-
题名基于图的多源数据融合框架研究
被引量:6
- 1
-
-
作者
匡广生
郭岩
俞晓明
刘悦
程学旗
-
机构
中国科学院大学
中国科学院计算技术研究所中国科学院网络数据科学与技术重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2021年第11期170-175,共6页
-
基金
国家重点研发计划(2017YFB0803302)。
-
文摘
在给定的任务中分析各种数据时,目前大多数研究只针对单源数据进行分析,缺乏应用于多源数据的方法。但如今数据日益丰富,因此提出一种多源数据融合框架,用于融合多种网络平台数据。同一平台数据中包含文本与各种属性,同时不同平台的数据在内容与形式方面也存在很大差异。然而现有的网络信息挖掘方法大多仅使用同一平台中的部分数据进行分析,忽略了不同平台的数据之间存在的相互作用。因此文中提出一种数据融合框架,一方面,能基于图的强大表示能力融合同一平台不同类型的特征,从而提升单个平台的任务性能;另一方面能够利用不同平台的数据特征,使其相互补充,从而提升多个平台的任务性能。文中讨论的融合数据类型包括文本、时间、作者信息,这些特征涉及连续特征、离散特征以及非结构化特征。所提框架在事件分类任务上提升了F 1值,验证了提出的多源数据框架的有效性。
-
关键词
融合表示
多源数据
图融合
-
Keywords
Fusion representation
Multi-source
Graph fusion
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于演化模式的推特话题流行度预测方法
- 2
-
-
作者
解伟凡
郭岩
匡广生
余智华
薛源海
沈华伟
-
机构
中国科学院计算技术研究所数据智能系统研究中心
中国科学院大学计算机科学与技术学院
中国科学院大学人工智能学院
-
出处
《计算机应用》
CSCD
北大核心
2022年第11期3364-3370,共7页
-
基金
国家自然科学基金资助项目(U21B2046)。
-
文摘
针对以往流行度预测方法未利用演化模式之间的差异和忽略预测时效性的问题,提出了一种基于演化模式的推特话题流行度预测方法。首先,基于K⁃SC算法对大量历史话题的流行度序列进行聚类,并得到6类演化模式;然后,使用各类演化模式下的历史话题数据分别训练全连接网络(FCN)作为预测模型;最后,为选择待预测话题的预测模型,提出幅度对齐的动态时间规整(AADTW)算法来计算待预测话题的已知流行度序列与各演化模式的相似度,并选取相似度最高的演化模式的预测模型进行流行度预测。在根据已知前20 h的流行度预测后5 h的流行度的任务中,与差分整合移动平均自回归(ARIMA)方法以及使用单一的全连接网络进行预测的方法相比,所提方法的预测结果的平均绝对百分比误差(MAPE)分别降低了58.2%和31.0%。实验结果表明,基于演化模式得到的模型群相较于单一模型能更加准确地预测推特话题流行度。
-
关键词
推特话题
演化模式
流行度预测
社交网络
时间序列
-
Keywords
Twitter topic
evolution pattern
popularity prediction
social network
time series
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-