期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于本地化差分隐私的多表星形连接查询
1
作者 张啸剑 曹小杰 +1 位作者 王宁 孟小峰 《软件学报》 北大核心 2025年第2期830-850,共21页
基于本地化差分隐私多关系表示上的Star-JOIN查询已得到研究者广泛关注.现有基于OLH机制与层次树结构的Star-JOIN查询算法存在根节点泄露隐私风险、τ-截断机制没有给出如何选择合适τ值等问题.针对现有算法存在的不足,提出一种有效且... 基于本地化差分隐私多关系表示上的Star-JOIN查询已得到研究者广泛关注.现有基于OLH机制与层次树结构的Star-JOIN查询算法存在根节点泄露隐私风险、τ-截断机制没有给出如何选择合适τ值等问题.针对现有算法存在的不足,提出一种有效且满足本地化差分隐私的Star-JOIN查询算法LPRR-JOIN(longitudinal path random response for join).该算法充分利用层次树的纵向路径结构与GRR机制,设计一种纵向本地扰动算法LPRR,该算法以所有属性纵向路径上的节点组合作为扰动值域.每个用户把自身元组映射到相应节点组合中,再利用GRR机制对映射后的元组进行本地扰动.为了避免事实表上存在的频率攻击,LPRR-JOIN算法允许每个用户利用阈值τ本地截断自身元组个数,大于τ条元组删减、小于τ条元组补充.为了寻找合适的τ值,LPRR-JOIN算法利用τ-截断带来的偏差与扰动方差构造总体误差函数,通过优化误差目标函数获得τ值;其次结合用户分组策略获得τ值的总体分布,再利用中位数获得合适的τ值.LPRR-JOIN算法与现有算法在3种多关系数据集上进行比较,实验结果表明其响应查询算法优于同类算法. 展开更多
关键词 本地化差分隐私 多表星形连接查询 层次结构 纵向节点组合 随机应答机制
在线阅读 下载PDF
联机分析查询处理中的一种聚集算法 被引量:14
2
作者 蒋旭东 冯建华 周立柱 《软件学报》 EI CSCD 北大核心 2002年第1期65-70,共6页
联机分析处理(online analytical processing,简称OLAP)查询是涉及大量数据的即席复杂查询,从SQL(structured query language)角度来看,这些查询通常都包含多表连接和分组聚集操作.从OLAP查询处理角度出发,提出一种新的基于排序的聚集... 联机分析处理(online analytical processing,简称OLAP)查询是涉及大量数据的即席复杂查询,从SQL(structured query language)角度来看,这些查询通常都包含多表连接和分组聚集操作.从OLAP查询处理角度出发,提出一种新的基于排序的聚集查询算法MuSA(sort-based aggregation with multi-table join).该方法充分考虑到数据仓库星型模式的特点,将聚集操作和新的多表连接算法MJoin相结合,排序时采用关键字映射技术对排序关键字进行压缩,从而可以显著地提高排序速度.此外,通过预先估计聚集分组的数目,优化选择不同的排序方法,使得算法对不同的分组聚集查询都进行优化.算法实验数据表明,这种聚集查询算法与传统的聚集查询处理方法相比,其性能有显著的提高. 展开更多
关键词 数据仓库系统 数据库 联机分析处理 查询 聚集算法
在线阅读 下载PDF
数据仓库查询处理中的一种多表连接算法 被引量:30
3
作者 蒋旭东 周立柱 《软件学报》 EI CSCD 北大核心 2001年第2期190-195,共6页
在进行数据仓库的 OLAP( online analytical processing,联机分析处理 )查询处理时 ,经常会涉及到多表连接操作 ,因此 ,提高多表连接的性能就成了数据仓库领域的关键性问题 .基于数据仓库的星型模式 ,给出了一种新的多表连接算法 ( M- J... 在进行数据仓库的 OLAP( online analytical processing,联机分析处理 )查询处理时 ,经常会涉及到多表连接操作 ,因此 ,提高多表连接的性能就成了数据仓库领域的关键性问题 .基于数据仓库的星型模式 ,给出了一种新的多表连接算法 ( M- Join) .与传统关系数据库管理系统的多表连接查询处理相比 ,该算法充分考虑了数据仓库中的数据本身和多表连接的特点 ,采用对多个表进行一次性连接的方法 ,使得查询的性能有明显的改善 .同时 ,还给出了算法的实验结果和分析 . 展开更多
关键词 数据仓库 OLAP 多表连接算法 数据库 数据查询处理
在线阅读 下载PDF
面向Flink的多表连接计算性能优化算法 被引量:1
4
作者 李旺 双锴 《计算机应用与软件》 北大核心 2021年第6期31-38,共8页
分布式计算引擎Flink已经被广泛应用到大规模数据分析处理领域,多表连接是Flink常见作业之一,因此提升Flink多表连接的性能可以加快数据处理和分析的速度。然而,直接将现有的多表连接优化算法应用到Flink上会带来两个问题:现有算法不能... 分布式计算引擎Flink已经被广泛应用到大规模数据分析处理领域,多表连接是Flink常见作业之一,因此提升Flink多表连接的性能可以加快数据处理和分析的速度。然而,直接将现有的多表连接优化算法应用到Flink上会带来两个问题:现有算法不能充分发挥Flink基于线程的轻量级计算模型的性能优势;连接算法需要shuffle的数据量过大。提出优化连接并行度的Multi Bushy Tree算法,尽可能提高多表连接计算的并行度;提出优化星型连接的Semi Join算法,可以大大减少需要shuffle的数据量。在TPC-H数据集上的实验结果表明,提出的算法可以有效提高多表连接计算的并行度,并缩短作业运行时间,减小星型连接中的网络IO代价。 展开更多
关键词 Flink 多表连接 连接并行度 数据shuffle 星型连接
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部