【示例教程】LEADTOOLS中如何使用文档清理命令接口来清理文档图像

原创|使用教程|编辑:黄竹雯|2017-12-19 15:42:22.000|阅读 43 次

概述:本文教大家如何利用LEADTOOLS进行这些优化。这里有一些最常用的清理功能,可以轻松应用于任何图像,进行这些基础的处理后可以使您更高级的功能成为更好的运行。

 
文档清理对文档成像有很大的影响。它改进了文档的视觉效果和可读性。文件图像清理是OCR,条形码,PDF,表单识别,档案等类似的功能的必备预处理,它可以增强了这些功能的效果和效率。
 
准确度 - 图像很少完美。原始文件中的颜色,角度,缺陷都会对识别技术的准确性产生影响。通过正确对齐图像并移除重要区域周围的障碍物,识别过程可以扫描图像,并寻找您要提取的文本和数据。
压缩 - 大多数压缩算法的工作原理是通过找到方法来巧妙地将像素组合在一起,使用较少的体积,但仍然将图像重建为原始图像(或接近原始的有损方法),未压缩数据。在文档中,黑白图像尤其如此。通过去除像素点,打孔和边框等不必要的伪像,可以得到更好的压缩效果。
速度 - 随着不必要的像素越来越少,几乎每个算法都可以更快地完成其工作。


使用LEADTOOLS进行文档图像清理

本文教大家如何利用LEADTOOLS进行这些优化。这里有一些最常用的清理功能,可以轻松应用于任何图像,进行这些基础的处理后可以使您更高级的功能成为更好的运行。
 
转换图像颜色(Inverted Image)

由于许多原因,双色图像可能会反转。扫描仪设置,反转调色板,彩色蒙版或从一种格式转换到另一种格式都可能导致应为黑色的像素为白色,反之亦然。这个功能可以在每个图像上运行。

去斑点(Despeckle)

斑点经常正图像、扫描仪或半色调中出现。它适用于白色背景上的黑色斑点和黑色背景上的白色斑点。运行此功能以删除它们。

移除直线(Line Removal)

两种最常见的线条来源是表格和纸张折叠。 在这两种情况下,即使与打印或手写的文本相交,也可以检测和删除窄的水平线或垂直线。这是任何识别技术的必备功能。

移除边框(Border Removal)

如果图像扫描时有平板背衬上有额外的空间,扫描仪将填充一个颜色的间隙。 如果它是黑色的,那么它可以被删除。
 
打孔移除(Hole Punch Removal)

如果扫描仪扫描出任何的打孔,并且黑色,您可以消除它们以恢复这些区域以匹配背景。
 
文档清理的其他功能
上述功能是可以应用于任何文档图像的通用文档清理功能。 LEADTOOLS提供了更多的文档图像处理功能,如歪斜校正,3D倾斜校正等,可用于更精确的处理。


标签:OCR SDKOCR

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动成果

登录 慧都网发表评论


暂无评论...

为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
相关厂商
相关产品
LEADTOOLS Imaging Pro Developer Toolkit

20多年的老牌图像处理控件,支持TWAIN扫描、200多种图像效果、150多种图像格式…

LEADTOOLS Document Imaging Suite Developer Toolkit

LEADTOOLS Document Imaging Suite SDK是LEADTOOLS SDK中各种特点的精选组合,这套强大的工具利用了LEAD行业领先的图像处理技术来智能地识别文档的特征,而根据文档的特征可以识别扫描的或传真的任何类型的表格图像。

LEADTOOLS Document Imaging Developer Toolkit

多语言的文档图像处理控件,支持光符识别处理、条形码扫描识别等。

LEADTOOLS Medical Imaging Developer Toolkit

LEADTOOLS Medical Imaging是一款医疗成像控件,包含了一些精心挑选的、经过优化的特性,可以满足医疗成像应用程序开发的特殊需要。

LEADTOOLS Medical Imaging Suite Developer Toolkit

LEADTOOLS Medical Imaging Suite帮您开发功能强大的PACS和医学成像应用程序

LEADTOOLS Multimedia Developer Toolkit

LEADTOOLS Multimedia SDK是一款功能强大的音频处理 / 视频处理控件,可创建具有专业水准的高品质的多媒体应用程序。

LEADTOOLS DVD Module

可以创建DVD影像,包括DVD影像接口,MPEG-2和MPEG-1 多路器,MPEG音频编码器,LEAD MPEG-2标准音频码

LEADTOOLS Medical Multimedia Module

可从一组同源的2D医疗影像来构建、查看、编辑3维体,并可用它包含的图像处理函数来提高可视化。

LEADTOOLS Streaming Module

LEADTOOLS Video Streaming Module是一个完美的解决方案,提供了一个非常卓越的多媒体工具包,同时利用 LEAD 视频和音频编码的优点可以减少需要的带宽。

LEADTOOLS Professional Asian OCR Module

LEADTOOLS Asian OCR Module在应用程序中增加了一些光学字符识别(OCR)技术的方法,并包含了开发健壮的,高性能的和可扩展的图像识别方案所需要的技术。

LEADTOOLS OCR Module - LEAD Engine

开发健壮的,高性能的和可扩展的图像识别方案所需要的OCR 识别技术。

LEADTOOLS OCR Module - OmniPage Engine

LEADTOOLS OCR Module - OmniPage Engine增加了对添加光学字符识别(OCR)和智能字符识别(ICR)技术到应用程序的方法,并且包含开发稳健的,高性能的和可扩展的图像识别解决方案所需要的一切。

LEADTOOLS ICR Module - OmniPage Engine

ICR Module - OmniPage Engine用于将ICR和OCR技术集成到应用程序中,并提供程序员强大,高性能,可扩展的图像识别解决方案。

LEADTOOLS Professional Arabic OCR Module

LEADTOOLS Arabic OCR Module增加了对添加光学字符识别(OCR)技术到应用程序的方法,并且包含开发稳健的,高性能的和可扩展的图像识别解决方案所需要的一切。

LEADTOOLS Recognition Imaging Developer Toolkit

条码图像识别开发包,帮您创建端到端文档图像应用程序的企业级文档自动化解决方案

LEADTOOLS PACS Imaging Developer Toolkit

开发功能强大的PACS Imaging应用程序的最佳选择

LEADTOOLS MPEG-2 Transport Module

包含DirectShow过滤器,用于创建和播放MPEG-2 传输和MPEG-2程序流,此外并能够从RTSP服务器产生流数据。

LEADTOOLS Document HTML5 Module

LEADTOOLS Document HTML5帮您开发强健、轻量级的跨平台文档图像处理应用程序。

LEADTOOLS Medical HTML5 Module

使用LEADTOOLS Medical HTML5 SDK Module开发下一代的DICOM和PACS图像处理应用程序。

LEADTOOLS Multimedia Suite Developer Toolkit

LEADTOOLS Multimedia SDK是专为开发各种跨行业音频/视频应用程序所设计的多媒体开发工具包。

LEADTOOLS Imaging HTML5 Module

LEADTOOLS Imaging HTML5 Module帮您开发强健、轻量级的跨平台图像应用程序

LEADTOOLS Barcode Pro Developer Toolkit

一款全面的可读写1D和2D条形码的软件开发工具包。

LEADTOOLS PDF Pro

LEADTOOLS PDF Pro 具备浏览光栅图与编辑PDF文件所需的所有功能。

在线
客服
在线
QQ
电话
咨询
400-700-1020
购物车 反馈 返回
顶部
在线客服系统
live chat