期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
勘察报告表格和文本信息提取算法研究
1
作者 李浩 《铁道技术标准(中英文)》 2024年第3期39-46,共8页
当前,勘察报告作为重要的工程设计依据,其中有大量表格和文本信息未被有效识别利用,为进一步打通专业软件研发的数据壁垒,有效识别和提取勘察报告信息迫在眉睫。针对该现状,本文设计Word表格及文本信息提取算法,并提出信息提取、显示和... 当前,勘察报告作为重要的工程设计依据,其中有大量表格和文本信息未被有效识别利用,为进一步打通专业软件研发的数据壁垒,有效识别和提取勘察报告信息迫在眉睫。针对该现状,本文设计Word表格及文本信息提取算法,并提出信息提取、显示和利用的一整套解决方案。基于文件读写库遍历Word表格,计算每个单元格的行列合并数,进而实现Word表格精准识别至Excel;基于文档自动化技术,记录Word表格范围,反向搜索获取表格标题。基于栈数据结构和匹配算法,遍历Word段落进行大纲匹配和范围计算,实现Word文本大纲信息识别;通过程序后台模拟复制粘贴操作将数据呈现在软件界面上。引入多线程机制,防止勘察报告信息提取操作阻塞主线程,引入并行分析机制,加速文本分析效率,进而提升软件的综合用户体验。以某一实际工程勘察报告为案例进行分析,验证该算法的适用性和准确性。 展开更多
关键词 算法 表格信息提取 文本信息提取 多线程
在线阅读 下载PDF
基于Mean-Shift的图像文本信息提取 被引量:5
2
作者 叶茂锹 周武能 朱黎博 《微型电脑应用》 2009年第1期7-9,4,共4页
图像和视频中包含着丰富的文本信息,提取和识别图像文本信息非常具有实际意义。传统的图像文本信息提取方法大多基于字符的代数和几何特征。作者从另一个角度出发,将彩色字符看成彩色图像的一部分,使类似字符的景物也可以被当作字符识... 图像和视频中包含着丰富的文本信息,提取和识别图像文本信息非常具有实际意义。传统的图像文本信息提取方法大多基于字符的代数和几何特征。作者从另一个角度出发,将彩色字符看成彩色图像的一部分,使类似字符的景物也可以被当作字符识别出来。提出一种基于Mean-Shift算法的图像文本信息提取方法,首先利用Mean-Shift算法对图像进行分割,然后对分割得到的文本区域进行投影分析从而将每个字符分割出来,最后将字符识别。 展开更多
关键词 文本信息提取 Mean-Shift图像分割 文本检测 投影分割
在线阅读 下载PDF
基于BERT与BiGRU-CRF的交通事故文本信息提取模型 被引量:3
3
作者 樊海玮 秦佳杰 +2 位作者 孙欢 张丽苗 鲁芯丝雨 《计算机与现代化》 2022年第5期10-15,共6页
针对现存交通事故文本信息中存在的大量时间、地点、伤亡损失等关键异构数据难以有效提取,以及用静态词向量深度学习模型提取交通事故文本信息精确度较低的问题,本文利用BERT(Bidirectional Encoder Representations from Transformers... 针对现存交通事故文本信息中存在的大量时间、地点、伤亡损失等关键异构数据难以有效提取,以及用静态词向量深度学习模型提取交通事故文本信息精确度较低的问题,本文利用BERT(Bidirectional Encoder Representations from Transformers)对文本字符进行动态向量映射,从数据表达源头解决一词多义、上下文依赖不充分等问题;利用BiGRU(Bi-Gate Recurrent Unit)提取文本向量化后的特征,输出高特征的文本序列;利用CRF(Conditional Random Fields)计算全局最优输出节点的概率优势,优化文本序列特征结果,提出一种基于动态字向量的BERT-BiGRU-CRF融合模型,用于交通事故文本关键信息提取。通过对比实验表明,该模型在交通事故文本信息提取中平均准确率为0.952,F1为0.925,比基于静态词向量Word2Vec模型的精确率与F1值分别提高了6.3个百分点和7.9个百分点。 展开更多
关键词 深度学习 文本信息提取 异构数据 BERT BiGRU CRF
在线阅读 下载PDF
自然场景图像中的文本信息提取研究
4
作者 李东勤 徐勇 《黑龙江科技信息》 2015年第36期131-133,共3页
自然场景中的文字提取技术成为了近几年计算机视觉领域的热门研究课题。本文对自然场景文本信息提取的关键技术进行了研究,全面总结了文本信息提取的研究现状,对文本检测定位和识别算法设计进行了有益的探索和研究,并对主流算法进行了... 自然场景中的文字提取技术成为了近几年计算机视觉领域的热门研究课题。本文对自然场景文本信息提取的关键技术进行了研究,全面总结了文本信息提取的研究现状,对文本检测定位和识别算法设计进行了有益的探索和研究,并对主流算法进行了分类和对比,最后总结了场景图像中文本信息提取存在的主要问题和评测方法。 展开更多
关键词 自然场景图像 文本信息提取 文本定位 文本识别
在线阅读 下载PDF
复杂背景图像文本信息提取技术研究
5
作者 江延湖 白似雪 《江西教育学院学报》 2008年第3期18-21,共4页
许多图像中包含的文本信息对于图像高层语义内容的自动理解、图像索引和检索非常有用。复杂背景图像中文本信息的提取一般包括文字的自动检测、定位、提取、分割和识别,由于图像中文本的大小、字体、字形、位置、排列和图像的清晰度、... 许多图像中包含的文本信息对于图像高层语义内容的自动理解、图像索引和检索非常有用。复杂背景图像中文本信息的提取一般包括文字的自动检测、定位、提取、分割和识别,由于图像中文本的大小、字体、字形、位置、排列和图像的清晰度、对比度等不定,使文本自动提取非常困难。文章对目前国内外图像中文本提取主要技术和发展方向进行了综述,便于该领域的研究人员了解和借鉴,同时指出了今后研究方向的热点。 展开更多
关键词 文本信息提取 图像 文字 检测 定位 识别 分割
在线阅读 下载PDF
基于控制系统与主题挖掘的网络文本信息提取方案研究
6
作者 陈锋 《自动化应用》 2017年第10期33-34,共2页
介绍基于控制系统与主题挖掘的网络文本信息提取概念,及其分类思想,重点阐述主题控制以及网络文本信息提取方案设计,并针对常见问题提出预防规避措施,以促进网络文本信息的提取速度,为管理计划开展创造稳定的基础环境。
关键词 控制系统 主题挖掘 文本信息提取
在线阅读 下载PDF
基于Mean-Shift的图像文本信息提取
7
作者 叶茂锹 周武能 朱黎博 《微型电脑应用》 2009年第7期51-53,56,共4页
图像和视频中包含着丰富的文本信息,提取和识别图像文本信息非常具有实际意义。传统的图像文本信息提取方法大多基于字符的代数和几何特征。作者从另一个角度出发,将彩色字符看成彩色图像的一部分,使类似字符的景物也可以被当作字符识... 图像和视频中包含着丰富的文本信息,提取和识别图像文本信息非常具有实际意义。传统的图像文本信息提取方法大多基于字符的代数和几何特征。作者从另一个角度出发,将彩色字符看成彩色图像的一部分,使类似字符的景物也可以被当作字符识别出来。文中提出一种基于Mean-Shift算法的图像文本信息提取方法,首先利用Mean-Shift算法对图像进行分割,然后对分割得到的文本区域进行投影分析从而将每个字符分割出来,最后将字符识别。 展开更多
关键词 文本信息提取 Mean-Shift图像分割 文本检测 投影分割
在线阅读 下载PDF
企业财务报告文本信息提取分析
8
作者 刘霁影 《营销界(理论与实践)》 2020年第1期185-185,共1页
财务报告是企业进行财务管理的重要内容,本文分析了一种从财务报告中自动提取文本的方法,以事件提取为核心,将财务报告的叙事信息映射到财务会计领域的概念,形成分布式财务信息异构数据的整合,并且此方法可应用于财务报表分析领域。
关键词 财务报告 文本信息提取 分析
在线阅读 下载PDF
PowerPoint课件文本信息提取研究 被引量:5
9
作者 江婷 赵呈领 谈国栋 《中国远程教育》 北大核心 2011年第3期69-72,共4页
本文通过分析Microsoft Office PowerPoint课件结构,提出了一个专用于PowerPoint课件文本信息提取的对象模型,并在该模型的基础上,利用Visual Basic语言开发了一个PowerPoint课件文本信息提取系统。通过该系统实现了对PowerPoint课件文... 本文通过分析Microsoft Office PowerPoint课件结构,提出了一个专用于PowerPoint课件文本信息提取的对象模型,并在该模型的基础上,利用Visual Basic语言开发了一个PowerPoint课件文本信息提取系统。通过该系统实现了对PowerPoint课件文本信息的有效提取,对于建立基于内容的PowerPoint课件检索模型提供了基础。本文重点阐述了两个关键技术环节:PowerPoint课件文本信息对象模型的建立,PowerPoint课件文本信息提取算法的设计与实现。 展开更多
关键词 POWERPOINT课件 教学资源 特征分析 文本信息提取
原文传递
文本信息深度提取及多关键词并行匹配技术研究 被引量:2
10
作者 王文奇 李勇 关云云 《计算机工程》 CAS CSCD 北大核心 2018年第12期281-287,共7页
目前文本信息提取与检索无法适应复杂环境、受用户权限限制以及面临存储器容量大的问题。为此,通过对各种文档文本信息的特征分析,建立基于并行的深度文本信息分析系统。基于XML细粒度表达的不同类型文档提取文本信息,采用基于多核的并... 目前文本信息提取与检索无法适应复杂环境、受用户权限限制以及面临存储器容量大的问题。为此,通过对各种文档文本信息的特征分析,建立基于并行的深度文本信息分析系统。基于XML细粒度表达的不同类型文档提取文本信息,采用基于多核的并行技术根据关键词检索分析提取的文本信息,最后输出信息分析结果。实验结果表明,该系统能够细粒度地深入分析不同类型文本信息,在检索词数量较多时,可以快速提取完整信息。 展开更多
关键词 XML细粒度表达 磁盘信息提取 文档文本信息提取 内存管理算法 并行搜索算法
在线阅读 下载PDF
一种基于角点与BP神经网络的文本检测及定位算法 被引量:1
11
作者 唐思源 高琦 邢俊凤 《现代电子技术》 北大核心 2016年第4期112-115,共4页
检测并提取视频图像中的文本信息对视频图像和内容的理解意义重大。以现有的文本检测算法为基础,提出一种基于角点与BP神经网络相结合的文本检测算法。该算法首先应用多尺度角点算法提取文本角点信息并初步定位文本行,接着提取文本特征... 检测并提取视频图像中的文本信息对视频图像和内容的理解意义重大。以现有的文本检测算法为基础,提出一种基于角点与BP神经网络相结合的文本检测算法。该算法首先应用多尺度角点算法提取文本角点信息并初步定位文本行,接着提取文本特征,最后应用BP神经网络精确定位文本。实验结果表明,此算法与经典方法相比具有更高的正确率和鲁棒性,视频中文本的正确检测率达到90.3%。 展开更多
关键词 文本检测算法 多尺度角点算法 BP神经网络 文本信息提取
在线阅读 下载PDF
药品不良反应自动化监测技术研究进展 被引量:20
12
作者 王远航 刘皈阳 《中国药物警戒》 2010年第1期41-44,共4页
目的对利用计算机网络技术、智能认别技术等自动监测药品不良反应的方法进行综述。方法检索相关文献,对相关研究进行整理、分析、统计和归纳。结果随着计算机和人工智能技术的发展,已经可以实现利用信息化技术自动监测药品不良反应。常... 目的对利用计算机网络技术、智能认别技术等自动监测药品不良反应的方法进行综述。方法检索相关文献,对相关研究进行整理、分析、统计和归纳。结果随着计算机和人工智能技术的发展,已经可以实现利用信息化技术自动监测药品不良反应。常用的方法有"触发器"技术和"文本信息提取"技术,其中"触发器"技术已有多项成功案例,而"文本信息提取"技术仍有一些关键性问题需要解决。结论使用计算机软件可以自动监测药品不良反应发生情况,该技术的应用可以弥补现行自发呈报漏报率高、时效性差的不足,是一种有着广泛应用前景的新兴技术。 展开更多
关键词 药品不良反应 自动化监测 触发器 文本信息提取
在线阅读 下载PDF
基于知识图谱的电力行业与外部数据融合研究 被引量:1
13
作者 刘锦隆 马进 +2 位作者 邹双 宋立华 王秋琳 《四川电力技术》 2020年第6期26-30,38,共6页
针对电力行业与外部多源异构数据融合利用的难题,提出了一种基于知识图谱的内外部数据融合应用思路。通过对现有文本信息提取以及知识图谱构建主流技术路线的分析,提出优化的文本信息提取方案及知识图谱构建方案,实现对多源异构数据融... 针对电力行业与外部多源异构数据融合利用的难题,提出了一种基于知识图谱的内外部数据融合应用思路。通过对现有文本信息提取以及知识图谱构建主流技术路线的分析,提出优化的文本信息提取方案及知识图谱构建方案,实现对多源异构数据融合建模工作的支撑。技术研究成果在某省电力公司开展了工程项目过程管理领域风险识别试点应用,验证了所提技术方案的可行性。 展开更多
关键词 多源异构数据融合 文本信息提取 知识图谱构建 企业管理风险识别
在线阅读 下载PDF
基于知识图谱技术的电力行业多源异构数据融合研究 被引量:3
14
作者 熊小舟 徐滢 +1 位作者 刘小康 罗坤 《中国高新科技》 2023年第3期111-112,132,共3页
文章针对电力行业内部与外部异构系统中存在的数据独立问题,提出了一种基于知识图谱的行业内外部数据融合解决方案。分析了目前文本信息提取以及知识图谱构建的主流技术路线,提出新的文本提取方案和知识图谱构建方案,实现对多源数据的... 文章针对电力行业内部与外部异构系统中存在的数据独立问题,提出了一种基于知识图谱的行业内外部数据融合解决方案。分析了目前文本信息提取以及知识图谱构建的主流技术路线,提出新的文本提取方案和知识图谱构建方案,实现对多源数据的融合与应用。该技术研究在某电力公司进行管理风险识别试点应用,验证了该研究成果的实用性。 展开更多
关键词 多源异构数据融合 知识图谱技术 文本信息提取 工程管理风险
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部