政府数据中敏感数据识别与隐私计量研究被引量：11

Research on Sensitive Data Identification and Privacy Measurement in Government Data

导出

摘要 [目的/意义]通过分析政府数据隐私相关文本,设计敏感数据识别方案,构建隐私计量模型,计量敏感数据的隐私值,为政府数据隐私保护提供理论依据.[方法/过程]首先筛选政府数据隐私的相关文本构建样本库;然后依据文本的句法结构,抽取敏感数据项、核心动词、程度词、否定词等词汇,构建政府数据隐私语义词表;最后以上述词汇组成的敏感数据单元为基础,构建隐私计量模型.[结果/结论]该方法基于隐私相关文本,准确析出政府数据的敏感数据,客观计量政府数据对象的隐私值,可为政府数据的隐私风险防范及隐私保护规范化提供支持. [Purpose/Significance]Through the analysis of government data privacy related texts,designing sensitive data identification scheme,building a privacy measurement model,and measuring the privacy value of sensitive data,this paper provides a theoretical basis for government data privacy protection.[Method/Process]First,filtered the relevant text of government data privacy to build a sample library;Then,according to the syntactic structure of the text,words such as sensitive data items,core verbs,degree words,negative words were extracted,it constructed the semantic vocabulary of government data privacy;Finally,based on the sensitive data unit composed of the above words,it constructed privacy measurement model.[Result/Conclusion]This method is based on privacy related texts,accurately extracts the sensitive data of government data,objectively measures the privacy value of government data objects,and provides support for the privacy risk prevention and privacy protection standardization of government data.

作者臧国全王家振毕崇武耿瑞利 Zang Guoquan;Wang Jiazhen;Bi Chongwu;Geng Ruili(School of Information Management,Zhengzhou University,Zhengzhou 45001;Research Institute of Data Science,Zhengzhou City,Zhengzhou 450001)

机构地区郑州大学信息管理学院郑州市数据科学研究中心

出处《图书情报工作》 CSSCI 北大核心 2022年第15期66-75,共10页 Library and Information Service

基金国家社会科学基金重大项目"政府数据的隐私风险计量与保护机制创新研究"(项目编号:21&ZD338)研究成果之一。

关键词政府数据数据隐私个人隐私语义词表隐私计量 government data data privacy personal privacy semantic vocabulary privacy measurement

分类号 G250 [文化科学—图书馆学]

引文网络
相关文献

参考文献25

1黄如花,吴子晗.中国政府数据开放共享政策的计量分析[J].情报资料工作,2017,38(5):6-12. 被引量：26
2杜荷花.我国政府数据开放平台隐私保护评价体系构建研究[J].情报杂志,2020,39(3):172-179. 被引量：45
3赵金旭,郑跃平.中国电子政务隐私保护问题探究——基于70个大中城市政府网站的“隐私声明”调查[J].电子政务,2016(7):81-93. 被引量：18
4商希雪,韩海庭.政府数据开放中个人信息保护路径研究[J].电子政务,2021(6):113-124. 被引量：32
5丁红发,孟秋晴,王祥,蒋合领.面向数据生命周期的政府数据开放的数据安全与隐私保护对策分析[J].情报杂志,2019,38(7):151-159. 被引量：101
6张聪丛,郜颍颍,赵畅,杜洪涛.开放政府数据共享与使用中的隐私保护问题研究——基于开放政府数据生命周期理论[J].电子政务,2018(9):24-36. 被引量：58
7臧国全,贾瑞莹.医疗数据中病种隐私的计量与分析[J].现代情报,2020,40(5):161-168. 被引量：7
8邓胜利,赵海平.信息泄露情境下的个人信息价值评估及个体差异:基于离散选择模型的实证研究[J].情报学报,2019,38(3):266-276. 被引量：20
9黄逸珺,陆桐,闫强.电子商务网站个人信息价值评估[J].北京邮电大学学报（社会科学版）,2017,19(5):33-41. 被引量：10
10张凯亮,臧国全.泄露概率情境下的个人数据隐私计量研究[J].图书情报工作,2021,65(9):62-69. 被引量：9

二级参考文献347

1唐琳,郭崇慧,陈静锋.中文分词技术研究综述[J].数据分析与知识发现,2020,4(2):1-17. 被引量：47
2沈艳,陈赟,黄卓.文本大数据分析在经济学和金融学中的应用:一个文献综述[J].经济学（季刊）,2019,18(4):1153-1186. 被引量：92
3郭明军,王建冬,安小米,李慧颖,张何灿.政务数据与社会数据平台化对接的演进历程及政策启示[J].电子政务,2020,0(3):32-39. 被引量：20
4王晴.基于SSCI的2012年国外档案学研究特征分布与热点探析[J].档案与建设,2013(8):14-18. 被引量：5
5李宇明.程度与否定[J].世界汉语教学,1999,13(1):29-36. 被引量：32
6张国宪.形容词的记量[J].世界汉语教学,1996,10(4):35-44. 被引量：56
7李荣陆,王建会,陈晓云,陶晓鹏,胡运发.使用最大熵模型进行中文文本分类[J].计算机研究与发展,2005,42(1):94-101. 被引量：96
8徐凤亚,罗振声.文本自动分类中特征权重算法的改进研究[J].计算机工程与应用,2005,41(1):181-184. 被引量：56
9黄建中,王肖雷.Katz平滑算法在中文分词系统中的应用[J].计算机工程,2004,30(B12):371-372. 被引量：5
10钮菊生.论现代公共政策的功能与特点[J].江海学刊,2001(5):71-75. 被引量：9

共引文献368

1严慧,刘晶晶.大数据时代隐私保护研究的前沿议题与演进趋势——基于国内外文献比较的可视化分析[J].政府管理评论,2022(1):128-148.
2杨中行.我国政务APP隐私保护政策研究——基于全国省级政务服务客户端隐私声明的调查[J].新闻研究导刊,2020,0(2):225-227. 被引量：6
3严娇,马静,房康.基于融合共现距离的句法网络下文本语义相似度计算[J].数据分析与知识发现,2019,3(12):93-100. 被引量：3
4毕崇武,叶光辉,李明倩,曾杰妍.基于标签语义挖掘的城市画像感知研究[J].数据分析与知识发现,2019,3(12):41-51. 被引量：7
5卢新元,陈泽茵,卢泉,王雪霖.省级政府数据开放平台的数据开放水平构型研究[J].知识管理论坛,2023(5):382-398.
6刘佳,刘贤明,纪晓萌.中国海洋旅游政策变迁研究(1995-2022年)——一个三维分析框架[J].社会科学家,2024(3):61-69. 被引量：1
7臧国全,张凯亮,肖洋,贾瑞莹.数据隐私风险的识别与消减——以医疗数据为例[J].情报学进展,2024(1):205-246.
8邱均平,徐中阳.数据计量学的学科构建及其发展趋势[J].情报学进展,2024(1):1-40.
9陈燕红.互联网多元治理模式下的个人信息共享风险及其保护对策[J].情报科学,2022,40(11):118-123. 被引量：1
10黄平平,冯晓娜,李志杰,刘建,刘文云.组态视角下政府数据开放中个人隐私保护研究[J].情报科学,2022,40(8):144-151. 被引量：7

同被引文献214

1张霁雯.社交媒体用户隐私关注、自我表露和隐私管理行为的实证研究[J].新媒体研究,2021(4):39-45. 被引量：3
2王丽莉,杨璐铭.公共安全视角下我国政府数据开放风险防范研究[J].中国社会公共安全研究报告,2018(2):59-72. 被引量：2
3郑彦宁,王益成,李会.面向政府激励场景的科技情报交互演化博弈与仿真研究[J].情报科学,2023,41(11):141-150. 被引量：4
4黄平平,冯晓娜,李志杰,刘建,刘文云.组态视角下政府数据开放中个人隐私保护研究[J].情报科学,2022,40(8):144-151. 被引量：7
5焦海涛.个人信息的反垄断法保护:从附属保护到独立保护[J].法学,2021(4):108-124. 被引量：107
6陈悦,陈超美,刘则渊,胡志刚,王贤文.CiteSpace知识图谱的方法论功能[J].科学学研究,2015,33(2):242-253. 被引量：7923
7戢渼钧.关于个性化信息服务的隐私保护[J].图书情报工作,2006,50(2):49-51. 被引量：20
8侯海燕,刘则渊,陈悦,姜春林,尹丽春,庞杰.当代国际科学学研究热点演进趋势知识图谱[J].科研管理,2006,27(3):90-96. 被引量：159
9赵金铭.汉语句法结构与对外汉语教学[J].中国语文,2010(3):277-286. 被引量：21
10肖健,徐建,徐晓兰,袁琦.英中可比语料库中多词表达自动提取与对齐[J].计算机工程与应用,2010,46(31):130-134. 被引量：12

引证文献11

1臧国全,张凯亮,肖洋,贾瑞莹.数据隐私风险的识别与消减——以医疗数据为例[J].情报学进展,2024(1):205-246.
2肖洋,臧国全.个人金融数据的敏感性识别与隐私计量研究[J].情报理论与实践,2023,46(9):105-114. 被引量：11
3吴宁博,李金燕,杨帆,丁红发.我国政府数据开放的隐私风险判定及其治理路径研究[J].情报杂志,2023,42(11):192-198. 被引量：7
4孙雄韬,刘干,李怡然,张舒越,文语欣.文本隐私感知与保护研究综述[J].网络空间安全科学学报,2023,1(2):2-21.
5申笑宇,罗书怡,胡文袁,贾新露.我国政府开放数据风险研究热点与趋势分析[J].网络安全与数据治理,2024,43(5):61-68.
6杨瑞仙,李航毅,孙倬.社交网络数据隐私保护:溯源、技术、政策、展望[J].农业图书情报学报,2024,36(4):4-20.
7袁静,周欣丽,臧国全,张凯亮.政府开放数据隐私风险研究:现状、特征及展望[J].图书情报知识,2024,41(4):67-81. 被引量：2
8张凯亮,臧国全,肖洋.医疗信息文本中的个人隐私数据识别与计量研究[J].情报学报,2024,43(8):936-945. 被引量：1
9于超,罗建军,张哲,李頔,戴明华.基于零信任架构的农业敏感数据信息监控系统设计与实现[J].网络安全技术与应用,2024(10):105-108. 被引量：1
10袁静,刘昭辉,李森涛.用户参与政府开放数据隐私风险协同治理动力的系统动力学仿真分析[J].数字图书馆论坛,2024,20(9):72-84.

二级引证文献21

1臧国全,张凯亮,肖洋,贾瑞莹.数据隐私风险的识别与消减——以医疗数据为例[J].情报学进展,2024(1):205-246.
2王玮,郭创拓.科技金融数据信息流通的现实风险与法律监管[J].法治论坛,2023(3):34-49. 被引量：1
3王冠,赵士伟,罗翔,狄梦远,曹子美.基于数字人民币的被监管人员代管金管理服务平台设计与实现[J].警察技术,2024(2):86-89.
4汤南苑.政府数据开放中的个人隐私泄露风险及其规避[J].领导科学论坛,2024(6):80-83.
5沈艳,冯冬发,陶云清.公共数据开放与中国县域数字创业[J].城市问题,2024(5):38-49. 被引量：4
6杨瑞仙,李航毅,孙倬.社交网络数据隐私保护:溯源、技术、政策、展望[J].农业图书情报学报,2024,36(4):4-20.
7袁静,周欣丽,臧国全,张凯亮.政府开放数据隐私风险研究:现状、特征及展望[J].图书情报知识,2024,41(4):67-81. 被引量：2
8臧国全,柴文科,张盼盼,张凯亮,孙倬,张恒苗.个人教育数据的敏感性识别与隐私计量研究[J].情报理论与实践,2024,47(8):84-94. 被引量：3
9陈秀萍,李振.防患于未然:基于风险矩阵的API金融数据泄露风险管理[J].金融市场研究,2024(7):128-138.
10张凯亮,臧国全,肖洋.医疗信息文本中的个人隐私数据识别与计量研究[J].情报学报,2024,43(8):936-945. 被引量：1

1黄葳,陈永进.中国垃圾分类研究概述——基于CNKI期刊文献的知识图谱分析[J].社会科学前沿,2021,10(3):734-742.
2李萌,李辰航.玉溪推进以人为核心新型城镇化建设的路径研究——基于苏州、重庆、成都、昆明等城市和玉溪的比较[J].云南社会主义学院学报,2022,24(1):102-111.
3王芳,杨碧涵,林妍敏,南雄雄,郑兰香,赵占宁.葡萄酒生产废弃物资源化利用研究——基于CiteSpace的知识图谱量化分析[J].农业展望,2021,17(7):78-88. 被引量：3
4安淇,肖华斌,张培元,刘莹.国外城市绿地生态系统文化服务研究进展[J].山东建筑大学学报,2020,35(1):76-82. 被引量：18
5陶灵灵,曹彦,张梦娇.支持目的与信誉度的隐私偏好规约模型[J].计算技术与自动化,2018,37(3):122-126. 被引量：1
6姜家鑫,黄志球,马薇薇.满足隐私需求的服务组合信息流控制方法研究[J].计算机科学与探索,2018,12(3):370-379. 被引量：2

图书情报工作

2022年第15期

浏览历史

内容加载中请稍等...

政府数据中敏感数据识别与隐私计量研究被引量：11

参考文献25

二级参考文献347

共引文献368

同被引文献214

引证文献11

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

政府数据中敏感数据识别与隐私计量研究 被引量：11

参考文献25

二级参考文献347

共引文献368

同被引文献214

引证文献11

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

政府数据中敏感数据识别与隐私计量研究被引量：11