提出一种(γ,l-p,k)-匿名模型,模型引入了信息熵作为计算缺损数据的属性距离,通过敏感属性度高低分为不同的敏感级别,并设置相应的权重ω值,同时让等价类元组的不同敏感级别个数满足阈值γ。接着根据模型设计了加权信息熵匿名算法(Weigh...提出一种(γ,l-p,k)-匿名模型,模型引入了信息熵作为计算缺损数据的属性距离,通过敏感属性度高低分为不同的敏感级别,并设置相应的权重ω值,同时让等价类元组的不同敏感级别个数满足阈值γ。接着根据模型设计了加权信息熵匿名算法(Weighted Information Entropy Anonymous Algorithm based on Defect-Sensitive Attributes,WISA^(*))对缺损型数据集进行匿名化。实验结果表明,该算法不仅可以减少等价类信息损失,同时提高了敏感属性的多样性,从而降低了数据隐私泄露风险且复杂度较低。展开更多
文摘提出一种(γ,l-p,k)-匿名模型,模型引入了信息熵作为计算缺损数据的属性距离,通过敏感属性度高低分为不同的敏感级别,并设置相应的权重ω值,同时让等价类元组的不同敏感级别个数满足阈值γ。接着根据模型设计了加权信息熵匿名算法(Weighted Information Entropy Anonymous Algorithm based on Defect-Sensitive Attributes,WISA^(*))对缺损型数据集进行匿名化。实验结果表明,该算法不仅可以减少等价类信息损失,同时提高了敏感属性的多样性,从而降低了数据隐私泄露风险且复杂度较低。
基金The National Natural Science Foundation of China under Grant Nos.61702041,61602267,61202006,61202030(国家自然科学基金)the Guangxi Key Laboratory of Trusted Software under Grant Nos.kx201610,kx201532(广西可信软件重点实验室研究课题).