期刊文献+
共找到196篇文章
< 1 2 10 >
每页显示 20 50 100
大语言模型文档图像智能问答指令设计与微调方法实证研究
1
作者 王文瑾 李昀昊 张寅 《数字图书馆论坛》 2025年第1期11-21,32,共12页
文档图像智能问答是实现数字图书馆智能化的关键技术之一。基于多模态预训练模型的文档图像智能问答技术能有效实现文本、视觉和布局信息的融合,但通常需要进行针对性的微调训练,成本高且无法应用于一些数据资源稀缺的场景。以ChatGPT... 文档图像智能问答是实现数字图书馆智能化的关键技术之一。基于多模态预训练模型的文档图像智能问答技术能有效实现文本、视觉和布局信息的融合,但通常需要进行针对性的微调训练,成本高且无法应用于一些数据资源稀缺的场景。以ChatGPT为代表的大语言模型具有良好的零样本学习能力,无需针对性微调即可在各个下游任务上取得良好表现,但大语言模型只能处理纯文本指令,无法直接处理文档图像。因此,提出利用空格符和换行符来模拟表示文档图像中文本间的相对位置关系,生成布局感知文本,并针对不同任务构造不同的指令模板,以文本指令形式指导大语言模型生成符合任务要求的答案。实验证明这种布局与任务感知的指令设计与微调方法显著提升了多种大语言模型的零样本文档图像智能问答表现,其最佳组合在DocVQA、InfographicVQA和MP-DocVQA 3个文档图像问答评测集上的零样本平均规范化莱文斯坦相似度分别为0.8651、0.5451和0.6129,达到甚至超过布局感知预训练模型的全量微调表现水平。所提方法还应用在大学数字图书馆国际合作计划(CADAL)民国报刊扫描文档智能问答场景中,提高读者在扫描文档中定位所需答案的效率。 展开更多
关键词 文档图像 智能问答 大语言模型 提示学习 指令微调
在线阅读 下载PDF
一种基于Transformer的双流文档图像质量评价算法
2
作者 焦树恒 张善卿 《软件工程》 2025年第2期42-45,51,共5页
为了解决文档图像质量评价网络对图像特征提取不充分、评价指标不恰当等问题,提出了一种基于Transformer的双流文档图像质量评价算法。首先,利用Transformer提取图像特征,计算特征通道间注意力;其次,使用权重模块预测文档图像OCR(光学... 为了解决文档图像质量评价网络对图像特征提取不充分、评价指标不恰当等问题,提出了一种基于Transformer的双流文档图像质量评价算法。首先,利用Transformer提取图像特征,计算特征通道间注意力;其次,使用权重模块预测文档图像OCR(光学字符识别)准确率作为文档图像质量得分,使用CNN(卷积神经网络)提取文档全局特征,全连接后预测图像的自然图像得分;最后,将两者得分结合作为预测图像的质量得分。实验结果表明,基于Transformer的双流文档图像质量评价算法在数据集上的皮尔逊线性相关系数(PLCC)达到0.9045,史比尔曼等级相关系数(SROCC)达到0.8775,证明该算法可以预测出更符合人类视觉标准的文档图像质量分数。 展开更多
关键词 图像质量评价 文档图像 TRANSFORMER 神经网络
在线阅读 下载PDF
基于改进YOLOv5s的文档图像版面分析算法
3
作者 尹玲 李家乐 黄勃 《软件导刊》 2025年第2期146-154,共9页
针对当前基于深度学习的版面分析方法存在效率低和训练成本高的问题,提出一种基于YOLOv5s改进的单阶段目标检测网络RCW-YOLO,并将其应用于文档图像版面分析任务。首先,通过Res2Net模块改进YOLOv5s中的C3模块,有效增强网络对文档图像多... 针对当前基于深度学习的版面分析方法存在效率低和训练成本高的问题,提出一种基于YOLOv5s改进的单阶段目标检测网络RCW-YOLO,并将其应用于文档图像版面分析任务。首先,通过Res2Net模块改进YOLOv5s中的C3模块,有效增强网络对文档图像多尺度特征的提取能力;其次,引入轻量级上采样算子CARAFE以优化特征融合网络,减少上采样过程中的信息丢失;最后,引入WIoUv3作为边界框回归损失函数,制定合适的梯度权益分配策略,以提升模型泛化能力和整体性能。实验结果表明,在CDLA、IIIT-AR-13K和PubLayNet数据集上,RCW-YOLO在mAP@0.50:0.95指标上分别达到了87.2%、76.4%和94.5%,优于现有的两阶段算法和其他单阶段算法,同时具有更低的计算量、参数量和更快的推断效率。 展开更多
关键词 文档图像版面分析 目标检测 YOLOv5s 多尺度特征提取
在线阅读 下载PDF
基于全局与局部特征的二阶段文档图像可见水印去除模型
4
作者 赵江锋 和红杰 +1 位作者 陈帆 杨树斌 《计算机科学》 CSCD 北大核心 2024年第2期172-181,共10页
可见水印是一种常用的数字图像版权保护手段。分析可见水印去除结果可以验证图像上水印的有效性,并为水印设计者提供设计或添加水印的参考和启发。目前,大多数的水印去除方法都是基于自然图像的研究,而文档图像在生活中也被广泛使用,但... 可见水印是一种常用的数字图像版权保护手段。分析可见水印去除结果可以验证图像上水印的有效性,并为水印设计者提供设计或添加水印的参考和启发。目前,大多数的水印去除方法都是基于自然图像的研究,而文档图像在生活中也被广泛使用,但由于缺乏公开的文档图像去水印数据集,相关文档图像的水印去除研究较少。为了探究水印去除方法在文档图像上的水印去除效果,构建了一个文档图像水印去除数据集(SDIWRD)。在对文档图像可见水印去除的研究中发现,使用已有的水印去除方法得到的水印去除结果中容易留下水印主体伪影或者轮廓伪影。为了解决这个问题,提出了一种基于全局与局部特征的二阶段文档图像可见水印去除模型(RWRNet),该模型采用由粗到细的二阶段的半实例归一化编解码器架构。在粗略阶段,使用全局与局部特征提取模块增强对全局空间特征的捕捉能力,同时保留对局部细节信息的提取能力,从而帮助进行水印去除;在细化阶段,细化网络共享粗略阶段权重,并构建循环特征融合模块来充分挖掘粗略阶段编解码器的重要特征,为细化阶段提供丰富的上下文信息,帮助进行细致的水印去除。此外,还结合了结构相似性损失来帮助获取更好的视觉质量。所提方法在SDIWRD数据集上进行了实验,实验结果显示PSNR达到了41.21 dB,SSIM达到了99.07%,RMSE降低至3.64,优于现有水印去除方法。另外也在公开的CLWD彩色水印去除数据集进行了实验,实验结果显示PNSR达到了39.31dB,SSIM达到98.81%,RMSE降低至3.50,也优于现有水印去除方法。实验结果证明了所提方法具有良好的泛化性和去水印的能力,能有效减轻水印伪影。最后还提出了一些防止水印去除的建议,在相关网站1)可公开访问所提出的方法和数据集。 展开更多
关键词 可见水印 水印去除 全局与局部特征提取 循环特征融合 文档图像
在线阅读 下载PDF
基于三维特征和Transformer的数字化古籍文档图像矫正
5
作者 赵微 牟大中 +2 位作者 李夏童 屈千林 曹鹏 《北京印刷学院学报》 2024年第8期66-72,共7页
古籍文档图像矫正是古籍文档数字化中的一个关键环节,对提高古籍数字化质量具有重要的现实意义。针对古籍中普遍存在的氧化弯曲、粘连折叠、装订方式特殊等原因导致的形变复杂、矫正难度大的问题,本文提出了一种基于深度学习和三维特征... 古籍文档图像矫正是古籍文档数字化中的一个关键环节,对提高古籍数字化质量具有重要的现实意义。针对古籍中普遍存在的氧化弯曲、粘连折叠、装订方式特殊等原因导致的形变复杂、矫正难度大的问题,本文提出了一种基于深度学习和三维特征信息提取的古籍文档图像矫正方法。首先使用U-Net形式的编码器-解码器提取古籍文档图像的三维特征,然后基于Transformer模型对得到的三维特征图进行后向映射,最后使用双线性插值得到矫正后的图像。为了验证所提出方法的有效性,在两个自制测试集上分别进行实验。实验结果表明,该方法在局部失真(Local Distortion,LD)概率上,相较于DewarpNet模型降低了2.61%~6.58%。实验证明所提出的方法能有效完成古籍文档图像的矫正任务,提升古籍数字化质量。 展开更多
关键词 古籍图像 文档图像矫正 三维信息提取 TRANSFORMER 编码器-解码器
在线阅读 下载PDF
联合度量指标损失和U-Net的文档图像二值化
6
作者 张晶 周稻祥 +1 位作者 吴永飞 冯姝 《计算机工程与设计》 北大核心 2024年第8期2400-2406,共7页
当前深度神经网络模型在图像分割时均采用交叉熵做训练损失函数,当损失值变小时评价指标不一定变得更优。为解决上述缺陷,提出一种基于度量指标损失的U-Net网络模型。由于错误接受率和错误拒绝率变小时度量指标F-Mea-sure会上升,因此构... 当前深度神经网络模型在图像分割时均采用交叉熵做训练损失函数,当损失值变小时评价指标不一定变得更优。为解决上述缺陷,提出一种基于度量指标损失的U-Net网络模型。由于错误接受率和错误拒绝率变小时度量指标F-Mea-sure会上升,因此构建半错误率损失函数。采用分治策略,将文档图像分割成固定大小的图像块,分别进行二值化。在文档图像竞赛数据集上进行大量对比实验,实验结果表明,该方法相比原始U-Net,在4个度量指标上均有提升,二值化结果图像的文字连通性更好、噪声更少。 展开更多
关键词 文档图像二值化 卷积神经网络 交叉熵 度量指标损失 打印图像 手写图像 深度学习
在线阅读 下载PDF
基于方向感知与注意力的文档图像阴影消除
7
作者 张豹 蔡志伟 +1 位作者 王存睿 战国栋 《大连民族大学学报》 CAS 2024年第3期233-239,247,共8页
文档图像易受光照影响产生的阴影区域,会严重影响用户的识别和阅读。针对现有阴影消除开放数据集少,纠正图像阴影消除质量较差的问题,提出了一种改进的生成对抗网络的文档图像阴影消除方法。该网络在原有双GAN网络结构基础上,引入阴影... 文档图像易受光照影响产生的阴影区域,会严重影响用户的识别和阅读。针对现有阴影消除开放数据集少,纠正图像阴影消除质量较差的问题,提出了一种改进的生成对抗网络的文档图像阴影消除方法。该网络在原有双GAN网络结构基础上,引入阴影感知方向上下文模块以及掩码注意力结构,并在掩码注意力模块后加入自适应注意力模块,通过并行结构自适应调整卷积核大小,融合不同尺度特征以获得更多特征信息。同时采用一种逐像素叠加的数据增强方法,解决文档阴影消除数据集缺乏的问题。实验结果表明在本文自建数据集上与DCGAN、ST-CGAN和DSC方法相比,评价指标PSNR与SSIM均有一定提升,本文实验方法优于现有文档去阴影先进方法。 展开更多
关键词 文档图像阴影消除 堆叠式 阴影方向感知上下文 掩码注意力
在线阅读 下载PDF
一种优化的文档图像分割方法 被引量:1
8
作者 朱庆生 林杰 张敏 《计算机科学》 CSCD 北大核心 2004年第4期151-153,共3页
文档图像在数字图书馆、电子商务以及电子政务等工程中已获得广泛应用。如何对文档图像进行有效的转换、存储和传输.成为人们研究的焦点。将文档图像分割成不同的区域,根据不同区域的特点分别进行处理,成为一种有效的解决方案。本文在... 文档图像在数字图书馆、电子商务以及电子政务等工程中已获得广泛应用。如何对文档图像进行有效的转换、存储和传输.成为人们研究的焦点。将文档图像分割成不同的区域,根据不同区域的特点分别进行处理,成为一种有效的解决方案。本文在传统的块分割和图层分割方法的基础上,提出了一种优化的文档图像分割思路,对这两种方法进行了合理的综合处理,能够取得更好的效果。 展开更多
关键词 文档图像分割 文档图像处理 块分割 层分割 计算机
在线阅读 下载PDF
改进SURF特征的维吾尔文复杂文档图像匹配检索 被引量:3
9
作者 阿丽亚·巴吐尔 努尔毕亚·亚地卡尔 +2 位作者 吾尔尼沙·买买提 阿力木江·艾沙 库尔班·吾布力 《智能系统学报》 CSCD 北大核心 2019年第2期296-305,共10页
针对图像局部特征的词袋模型(Bag-of-Word, BOW)检索研究中聚类中心的不确定性和计算复杂性问题,提出一种由不同种类的距离进行相似程度测量的检索和由匹配点数来检索的方法。这种方法首先需要改进文档图像的SURF特征,有效降低特征提取... 针对图像局部特征的词袋模型(Bag-of-Word, BOW)检索研究中聚类中心的不确定性和计算复杂性问题,提出一种由不同种类的距离进行相似程度测量的检索和由匹配点数来检索的方法。这种方法首先需要改进文档图像的SURF特征,有效降低特征提取复杂度;其次,对FAST+SURF特征实现FLANN双向匹配与KD-Tree+BBF匹配,在不同变换条件下验证特征鲁棒性;最后,基于这两种检索方法对已收集整理好的各类维吾尔文文档图像数据库进行检索。实验结果表明:基于距离的相似性度量复杂度次于基于匹配数目的检索,而且两种检索策略都能满足快速、精确查找需求。 展开更多
关键词 复杂文档 维吾尔文档图像 文档图像分割 特征提取 SURF特征 FLANN双向匹配 KD-Tree+BBF匹配 图像检索
在线阅读 下载PDF
一种基于Hough变换的文档图像倾斜纠正方法 被引量:20
10
作者 李政 杨扬 +1 位作者 颉斌 王宏 《计算机应用》 CSCD 北大核心 2005年第3期583-585,共3页
在对文本扫描输入的过程中,文本图像不可避免地会发生倾斜,倾斜校正将为图文分割、文字识别等后续处理工作创造良好的条件。提出了一种基于Hough变换的检测图像倾斜度的方法,为了克服Hough变换计算量大的缺点,该方法首先选取局部代表性... 在对文本扫描输入的过程中,文本图像不可避免地会发生倾斜,倾斜校正将为图文分割、文字识别等后续处理工作创造良好的条件。提出了一种基于Hough变换的检测图像倾斜度的方法,为了克服Hough变换计算量大的缺点,该方法首先选取局部代表性子区域并提取其图像水平边缘,然后对提取的水平边缘进行两级Hough变换,从而实现了准确性与快速性的很好结合。 展开更多
关键词 倾斜角检测校正 HOUGH变换 文档图像
在线阅读 下载PDF
视觉文档图像的几何校正 被引量:10
11
作者 田学东 马兴杰 +1 位作者 韩磊 刘海博 《计算机应用》 CSCD 北大核心 2007年第12期3045-3047,共3页
在以数码相机等数字设备拍摄文档资料时,所拍摄的图像经常会产生各种各样的几何变形,这种变形可能会导致识别软件中的版面分析和切分算法失效,从而使文档图像无法被识别。为了使普通的识别软件能够对数码相机等拍摄的文档图像进行识别,... 在以数码相机等数字设备拍摄文档资料时,所拍摄的图像经常会产生各种各样的几何变形,这种变形可能会导致识别软件中的版面分析和切分算法失效,从而使文档图像无法被识别。为了使普通的识别软件能够对数码相机等拍摄的文档图像进行识别,有必要对其进行几何校正。根据几何变形产生的原因对其进行了分类,并针对不同种类的变形提出了相应的校正算法。实验结果证明该分类方法和相应校正算法都有较好的效果。 展开更多
关键词 OCR 视觉文档图像 几何变形 透视变形
在线阅读 下载PDF
基于投影的文档图像倾斜校正方法 被引量:21
12
作者 张顺利 李卫斌 吉军 《计算机工程与应用》 CSCD 北大核心 2010年第3期166-168,共3页
针对文档图像的倾斜校正问题,提出了一种新的基于投影的文档图像倾斜角检测方法。首先采用一种高效的像素遍历算法对文档图像从不同角度进行投影,然后对投影数据进行累加求和,通过比较不同角度下的累加和来确定倾斜角度。该方法在投影... 针对文档图像的倾斜校正问题,提出了一种新的基于投影的文档图像倾斜角检测方法。首先采用一种高效的像素遍历算法对文档图像从不同角度进行投影,然后对投影数据进行累加求和,通过比较不同角度下的累加和来确定倾斜角度。该方法在投影过程中只需对文档图像进行极少部分投影,因而大大减少了运算量。基于该方法的特点,提出了由"粗"到"精"的投影策略,在确保检测精度的同时大幅提高了检测速度。实验结果表明,方法非常有效,可以获得很高的检测精度。 展开更多
关键词 图像处理 倾斜校正 文档图像
在线阅读 下载PDF
融合背景估计与U-Net的文档图像二值化算法 被引量:10
13
作者 熊炜 王鑫睿 +2 位作者 王娟 刘敏 曾春艳 《计算机应用研究》 CSCD 北大核心 2020年第3期896-900,共5页
针对低质量文档图像存在页面污渍、墨迹浸润、背景纹理等多种退化因素,提出一种融合背景估计与U型卷积神经网络(U-Net)的文档图像二值化算法。该算法首先进行图像对比度增强,然后通过形态学闭操作来估计文档图像背景,并利用全卷积网络,... 针对低质量文档图像存在页面污渍、墨迹浸润、背景纹理等多种退化因素,提出一种融合背景估计与U型卷积神经网络(U-Net)的文档图像二值化算法。该算法首先进行图像对比度增强,然后通过形态学闭操作来估计文档图像背景,并利用全卷积网络,即U-Net对背景减除图像进行前景背景分割,最后采用全局最优阈值处理方法获得最终二值图像。实验结果表明,在2016和2017年国际文档图像二值化竞赛(DIBCO)中该算法的F值(F-measure,FM)、伪F值(pseudo F-measure,p-FM)、峰值信噪比(peak signal to noise ratio,PSNR)、距离倒数失真度量(distance reciprocal distortion,DRD)比性能次优的经典算法最高有5.58%、2.47%、0.86 dB、1.19%的性能提升。 展开更多
关键词 文档图像二值化 对比度增强 形态学闭操作 U型卷积神经网络 全局最优阈值处理
在线阅读 下载PDF
文档图像二值化算法VFCM 被引量:7
14
作者 童立靖 陈侃 +1 位作者 付晓玲 段建勇 《计算机工程与设计》 CSCD 北大核心 2009年第13期3216-3218,3243,共4页
为了提高基于拍摄方式的文档图像的二值化效果,降低光学字符识别(optical character recognition,OCR)系统的文字识别错误率,提出了一种全局阈值与局部阈值相结合的二值化算法——VFCM。该算法使用最大方差比方法产生全局阈值,使用FCM(F... 为了提高基于拍摄方式的文档图像的二值化效果,降低光学字符识别(optical character recognition,OCR)系统的文字识别错误率,提出了一种全局阈值与局部阈值相结合的二值化算法——VFCM。该算法使用最大方差比方法产生全局阈值,使用FCM(FuzzyC-Means)聚类方法产生局部阈值。这两种方法的结合能够较好地保留字符的笔画细节,并能有效地消除伪影。实验结果表明,该算法可以取得比较好的二值化效果,并能带来OCR系统识别率的有效提高。 展开更多
关键词 二值化 文档图像 阈值 最大方差比 模糊C均值算法
在线阅读 下载PDF
基于最小二乘法的文档图像倾斜检测方法 被引量:15
15
作者 王姝华 李佐 蔡士杰 《计算机应用与软件》 CSCD 北大核心 2001年第9期43-46,共4页
在文档扫描过程中,输入的文档图像不可避免地会发生倾斜现象,而布局分析及字符识别算法对页面倾斜都十分敏感,因此倾斜检测和校正是文档分析预处理的重要环节。本文提出了一个基于最小二乘法的倾斜检测方法。它将字符连通区包围盒底边... 在文档扫描过程中,输入的文档图像不可避免地会发生倾斜现象,而布局分析及字符识别算法对页面倾斜都十分敏感,因此倾斜检测和校正是文档分析预处理的重要环节。本文提出了一个基于最小二乘法的倾斜检测方法。它将字符连通区包围盒底边中心点作为特征点,利用文本行中特征点与基线的关系,将特征点用最小二乘法拟合出基线的方向,即为页面倾斜方向。同时,本文介绍了一种基于直线拟合的快速倾斜校正算法。实验证明,该算法速度快,准确度高。 展开更多
关键词 倾斜检测 倾斜校正 文档图像 最小二乘法 图像处理 办公自动化
在线阅读 下载PDF
基于游长平滑的文档图像倾斜校正 被引量:11
16
作者 汪同庆 朱永权 王洪 《计算机工程》 CAS CSCD 北大核心 2004年第1期141-143,共3页
图像获取设备将纸质文档转换为文档图像时,文档图像不可避免地存在一定的倾 斜。目前,对于倾斜文档图像的处理仍然存在许多困难,因此有必要对倾斜的文档图像进行 倾斜校正。但是文档版面十分复杂,包含文字、图像、图形和表格等内容... 图像获取设备将纸质文档转换为文档图像时,文档图像不可避免地存在一定的倾 斜。目前,对于倾斜文档图像的处理仍然存在许多困难,因此有必要对倾斜的文档图像进行 倾斜校正。但是文档版面十分复杂,包含文字、图像、图形和表格等内容,所以文档图像倾 斜校正存在着一定的困难。文章提出了基于游长平滑处理的文档图像倾斜校正方法,实验表 明该方法具有倾斜校正速度快、精度高和适应性强的特点。已经在重庆市北碚区档案管理数 字化系统中得到成功应用。 展开更多
关键词 游长平滑 倾斜校正 文档图像
在线阅读 下载PDF
基于背景估计和边缘检测的文档图像二值化 被引量:15
17
作者 许海洋 马龙龙 吴健 《计算机应用与软件》 CSCD 北大核心 2014年第8期196-200,共5页
为提高文档图像在对比度低、光照不均、大块噪声等复杂图像背景下二值化效果,提出一种背景估计与边缘检测相结合的图像二值化方法。该方法先利用Sauvola算法有效地估计图像的背景,并在此基础上,结合改进的Canny算法获取边缘变化信息,利... 为提高文档图像在对比度低、光照不均、大块噪声等复杂图像背景下二值化效果,提出一种背景估计与边缘检测相结合的图像二值化方法。该方法先利用Sauvola算法有效地估计图像的背景,并在此基础上,结合改进的Canny算法获取边缘变化信息,利用基于局部阈值的策略进行二值化。实验结果表明,该算法取得了较好的二值化效果,在开放的DIBCO 2011数据集上测试,其性能与Otsu、Niblack、Sauvola经典方法相比有大幅提高,其F值比ICDAR2011二值化竞赛中第一名的算法略有提高。 展开更多
关键词 文档图像 二值化 背景估计 边缘检测 CANNY 局部阈值法
在线阅读 下载PDF
彩色文档图像的倾斜自动校正算法 被引量:10
18
作者 何希平 李云峰 朱庆生 《中国图象图形学报》 CSCD 北大核心 2006年第3期367-371,共5页
对彩色扫描文档进行倾斜校正是对其进行OCR等处理所必须首先经历的步骤,为了对彩色倾斜文档图像进行准确、高效校正,提出了一种新的彩色文档图像的倾斜自动校正算法,该算法包括倾斜检测算法和倾斜校正算法。其中,倾斜检测算法解决了准... 对彩色扫描文档进行倾斜校正是对其进行OCR等处理所必须首先经历的步骤,为了对彩色倾斜文档图像进行准确、高效校正,提出了一种新的彩色文档图像的倾斜自动校正算法,该算法包括倾斜检测算法和倾斜校正算法。其中,倾斜检测算法解决了准确获得图像的倾斜角的问题;而倾斜校正算法则除了完成图像的旋转变换外,还通过色彩补偿解决了由于整数运算所造成的“锯齿”现象。倾斜检测是通过纹理复杂性分析实现的,而色彩补偿则是基于颜色线性相关的双线性插值算法。实验表明,该算法较好地解决了彩色文档图像的倾斜自动校正问题,它对于具有单一背景的彩色文档图像是准确、高效、实用的。 展开更多
关键词 彩色文档图像 倾斜 检测 自动校正 纹理复杂性 颜色补偿
在线阅读 下载PDF
改进的文档图像扭曲校正方法 被引量:10
19
作者 宋丽丽 吴亚东 孙波 《计算机工程》 CAS CSCD 北大核心 2011年第1期204-206,共3页
由照相机拍摄的文档图像可能因扭曲变形导致OCR软件不能正确识别。为解决上述问题,采用图像分割技术进行单词及文本线检测,利用线性拟合得到单词的较低基线和较高基线,根据校正基线对单词进行旋转和垂直位移,得到校正后的图像。实验结... 由照相机拍摄的文档图像可能因扭曲变形导致OCR软件不能正确识别。为解决上述问题,采用图像分割技术进行单词及文本线检测,利用线性拟合得到单词的较低基线和较高基线,根据校正基线对单词进行旋转和垂直位移,得到校正后的图像。实验结果表明,该方法能快速有效地校正扭曲的文档图像,使校正后的图像在光学字符识别阶段的识别率有较大提高。 展开更多
关键词 文档图像扭曲校正 图像内容分割 校正基线
在线阅读 下载PDF
基于文档图像的抗打印—扫描数字水印技术 被引量:7
20
作者 谭论正 朱宁波 孙星明 《计算机应用研究》 CSCD 北大核心 2007年第12期199-200,265,共3页
针对文档图像的特点提出了一种基于文档图像的盲检测水印算法。该算法能抵抗打印—扫描的攻击。首先对文档图像进行字符分割,使每块只包含一个字符;然后对每块进行线性规范化规范块大小,对规范的块进行三级离散小波变换(DWT),通过调整... 针对文档图像的特点提出了一种基于文档图像的盲检测水印算法。该算法能抵抗打印—扫描的攻击。首先对文档图像进行字符分割,使每块只包含一个字符;然后对每块进行线性规范化规范块大小,对规范的块进行三级离散小波变换(DWT),通过调整细节子带系数的正负号的数量来嵌入水印信息。实验结果表明,该算法适用于文档图像,能抵抗打印—扫描攻击。 展开更多
关键词 数字水印 文档图像 打印一扫描
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部