企业日常运营中频繁面临非结构化数据的检索、编辑与分析工作,在文档整理、内容比对、报告撰写等方面耗费大量人力成本。本文以职业年金信息披露处理的典型应用场景为例,梳理了对多数据源复杂非结构化文档的数据抽取、比对中面临的挑战...企业日常运营中频繁面临非结构化数据的检索、编辑与分析工作,在文档整理、内容比对、报告撰写等方面耗费大量人力成本。本文以职业年金信息披露处理的典型应用场景为例,梳理了对多数据源复杂非结构化文档的数据抽取、比对中面临的挑战与困难,对比分析了机器人流程自动化(robotic process automation,RPA)和预训练模型两种解决方式,阐述了基于预训练模型的方案设计实现及优势。通过预训练模型,极大地提高了非结构化文档智能化处理水平。展开更多
针对当前云计算环境中因缺乏多级安全机制而使结构化文档容易产生信息泄露和非授权访问等问题,提出基于行为的多级访问控制(action-based multilevel access control model,AMAC)模型并给出策略的形式化描述.利用信息流中的不干扰理论建...针对当前云计算环境中因缺乏多级安全机制而使结构化文档容易产生信息泄露和非授权访问等问题,提出基于行为的多级访问控制(action-based multilevel access control model,AMAC)模型并给出策略的形式化描述.利用信息流中的不干扰理论建立AMAC不干扰模型,并证明AMAC模型中多级访问控制策略的安全性.与已有访问控制模型的比较与分析表明,AMAC模型既可以利用角色、上下文和用户访问行为以提高访问控制策略的灵活性,还可以依据用户,用户访问行为和结构化文档的安全等级实现多级安全机制.展开更多
为利用网站设计的视觉原则并降低钓鱼者修改网页代码组织方式对钓鱼检测的影响,提出基于网页主视觉区域的结构化文档DMVA (document based on main visual area)检测钓鱼网站。提出子间归并算法生成网页的视觉分块;基于用户的视觉行为,...为利用网站设计的视觉原则并降低钓鱼者修改网页代码组织方式对钓鱼检测的影响,提出基于网页主视觉区域的结构化文档DMVA (document based on main visual area)检测钓鱼网站。提出子间归并算法生成网页的视觉分块;基于用户的视觉行为,结合层DOM树的分层结构,提出主视觉区域的思想,获取网页的分层主视觉区域中文本信息,构造DMVA;提出相关网站集,计算待测网站和相关网站集中网页间的DMVA的相似性,检测钓鱼网站。实验结果表明,基于DMVA检测钓鱼网站算法钓鱼检测方法具有较好的准确度。展开更多
文摘企业日常运营中频繁面临非结构化数据的检索、编辑与分析工作,在文档整理、内容比对、报告撰写等方面耗费大量人力成本。本文以职业年金信息披露处理的典型应用场景为例,梳理了对多数据源复杂非结构化文档的数据抽取、比对中面临的挑战与困难,对比分析了机器人流程自动化(robotic process automation,RPA)和预训练模型两种解决方式,阐述了基于预训练模型的方案设计实现及优势。通过预训练模型,极大地提高了非结构化文档智能化处理水平。
文摘针对当前云计算环境中因缺乏多级安全机制而使结构化文档容易产生信息泄露和非授权访问等问题,提出基于行为的多级访问控制(action-based multilevel access control model,AMAC)模型并给出策略的形式化描述.利用信息流中的不干扰理论建立AMAC不干扰模型,并证明AMAC模型中多级访问控制策略的安全性.与已有访问控制模型的比较与分析表明,AMAC模型既可以利用角色、上下文和用户访问行为以提高访问控制策略的灵活性,还可以依据用户,用户访问行为和结构化文档的安全等级实现多级安全机制.
文摘为利用网站设计的视觉原则并降低钓鱼者修改网页代码组织方式对钓鱼检测的影响,提出基于网页主视觉区域的结构化文档DMVA (document based on main visual area)检测钓鱼网站。提出子间归并算法生成网页的视觉分块;基于用户的视觉行为,结合层DOM树的分层结构,提出主视觉区域的思想,获取网页的分层主视觉区域中文本信息,构造DMVA;提出相关网站集,计算待测网站和相关网站集中网页间的DMVA的相似性,检测钓鱼网站。实验结果表明,基于DMVA检测钓鱼网站算法钓鱼检测方法具有较好的准确度。