LEADTOOLS使用教程:自动识别和处理表格

翻译|使用教程|编辑:莫成敏|2020-04-29 14:11:45.753|阅读 47 次

概述:本文主要介绍通过LEADTOOLS 识别SDK技术,解决在表单扫描过程扫描仪可能产生噪音以及其他的问题。

# 您正在找协同办公软件吗?点击这里站长给您推荐 #

相关链接:

LEADTOOLS (Lead Technology)由Moe Daher and Rich Little创建于1990年,其总部设在北卡罗来纳州夏洛特。LEAD的建立是为了使Daher先生在数码图象与压缩技术领域的发明面向市场。在过去超过20多年的发展历程中,LEAD以其在全世界主要国家中占有的市场领导地位,在数码图象开发工具领域中已成为既定的全球领导者。LEADTOOLS开发与发布的LEAD是屡获殊荣的开发工具包。

点击查看LEADTOOLS系列产品

本文主要介绍通过LEADTOOLS 识别SDK技术,可以解决在表单扫描过程扫描仪可能产生噪音以及其他的问题。

LEADTOOLS中包含表单识别和处理SDK技术的产品有,LEADTOOLS Recognition Imaging Developer ToolkitLEADTOOLS Document Imaging Developer Toolkit


处理表格和发票是许多公司日常工作流程的很大一部分。当某人填写表格副本并将其扫描回公司时,则需要提取该信息。许多OCR引擎都在努力提取此信息,因为表单的扫描分辨率可能比原始表单低,扫描仪可能会产生噪音,或者字段可能是非结构化的且动态生成的。值得庆幸的是,LEADTOOLS Forms Recognition SDK可以解决所有这些问题,并且不需要任何其他手动处理。这些先进的表单识别和OCR库由LEAD的专利机器学习算法提供支持,可以处理结构化和非结构化表格,可以帮助公司节省宝贵的时间和金钱。


快速准确的表单识别的主要组件来自两个LEADTOOLS引擎,AutoFormsEngine和和IOcrEngine。AutoFormsEngine提供了高级的表单识别和处理能力,以识别、处理和创建表单,而IOcrEngine是LEADTOOLS提供的所有OCR功能的切入点。

下面的代码显示了运行.NET表单识别和OCR应用程序所需的核心。

// Add these global members
static AutoFormsEngine autoEngine;
static RasterCodecs codecs;
static IOcrEngine ocrEngine;
static DiskMasterFormsRepository formsRepository;

// Initialize the Engines
static void InitFormsEngines()
{
	codecs = new RasterCodecs();

	ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.LEAD, false);
	ocrEngine.Startup(codecs, null, null, @"C:\LEADTOOLS 20\Bin\Common\OcrLEADRuntime");

	formsRepository = new DiskMasterFormsRepository(codecs, @"C:\Users\Public\Documents\
	LEADTOOLS Images\Forms\MasterForm Sets\OCR");
	autoEngine = new AutoFormsEngine(formsRepository, ocrEngine, null,
	AutoFormsRecognitionManager.Default | AutoFormsRecognitionManager.Ocr, 30, 80, true);
}

// Recognize and Process a Form
static void RecognizeAndProcessForm()
{
	string resultMessage = "Form not recognized";
	string formToRecognize = @"C:\Users\Public\Documents\LEADTOOLS Images\Forms\Forms to be Recognized\
	OCR\W9_OCR_Filled.tif";

	AutoFormsRunResult runResult = autoEngine.Run(formToRecognize, null);
	if (runResult != null)
	{
	   FormRecognitionResult recognitionResult = runResult.RecognitionResult.Result;
	   resultMessage = $@"This form has been recognized as a
	   {runResult.RecognitionResult.MasterForm.Name} with {recognitionResult.Confidence} confidence.";
	}

	Console.WriteLine("Recognition Results:");
	Console.WriteLine("=========================================================================");
	ShowProcessedResults(runResult);
}

// Print the output of the results
private static void ShowProcessedResults(AutoFormsRunResult runResult)
{
   string resultsMessage = "";

    foreach (FormPage formPage in runResult.FormFields)
        foreach (FormField field in formPage)
            if (field != null)
                resultsMessage = $"{resultsMessage}{field.Name} =
                {(field.Result as TextFormFieldResult).Text}\n";

    Console.WriteLine("Field Processing Results:");
    Console.WriteLine(resultsMessage);
}

如果要自己进行测试,请确保从我们网站直接获得最新的LEADTOOLS SDK安装包,让您免费体验!

相关内容推荐:

LEADTOOLS 使用教程>>>


想要购买LEADTOOLS正版授权,或了解更多产品信息请点击【咨询在线客服】






标签:

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,尊重他人劳动成果

文章转载自:LEADTOOLS https://www.leadtools.com/blog/document-imaging/forms-recognition-processing/tutorial-auto-recognize-process-form/

登录 慧都网发表评论


暂无评论...

为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
相关厂商
相关产品
LEADTOOLS Imaging Pro Developer Toolkit

20多年的老牌图像处理控件,支持TWAIN扫描、200多种图像效果、150多种图像格式…

LEADTOOLS Document Imaging Suite Developer Toolkit

LEADTOOLS Document Imaging Suite SDK是LEADTOOLS SDK中各种特点的精选组合,这套强大的工具利用了LEAD行业领先的图像处理技术来智能地识别文档的特征,而根据文档的特征可以识别扫描的或传真的任何类型的表格图像。

LEADTOOLS Document Imaging Developer Toolkit

多语言的文档图像处理控件,支持光符识别处理、条形码扫描识别等。

LEADTOOLS Medical Imaging Developer Toolkit

LEADTOOLS Medical Imaging是一款医疗成像控件,包含了一些精心挑选的、经过优化的特性,可以满足医疗成像应用程序开发的特殊需要。

LEADTOOLS Medical Imaging Suite Developer Toolkit

LEADTOOLS Medical Imaging Suite帮您开发功能强大的PACS和医学成像应用程序

LEADTOOLS Multimedia Developer Toolkit

LEADTOOLS Multimedia SDK是一款功能强大的音频处理 / 视频处理控件,可创建具有专业水准的高品质的多媒体应用程序。

LEADTOOLS DVD Module

可以创建DVD影像,包括DVD影像接口,MPEG-2和MPEG-1 多路器,MPEG音频编码器,LEAD MPEG-2标准音频码

LEADTOOLS Medical Multimedia Module

可从一组同源的2D医疗影像来构建、查看、编辑3维体,并可用它包含的图像处理函数来提高可视化。

LEADTOOLS Streaming Module

LEADTOOLS Video Streaming Module是一个完美的解决方案,提供了一个非常卓越的多媒体工具包,同时利用 LEAD 视频和音频编码的优点可以减少需要的带宽。

LEADTOOLS OCR Module - LEAD Engine

开发健壮的,高性能的和可扩展的图像识别方案所需要的OCR 识别技术。

LEADTOOLS OCR Module - OmniPage Engine

LEADTOOLS OCR Module - OmniPage Engine增加了对添加光学字符识别(OCR)和智能字符识别(ICR)技术到应用程序的方法,并且包含开发稳健的,高性能的和可扩展的图像识别解决方案所需要的一切。

LEADTOOLS ICR Module - OmniPage Engine

ICR Module - OmniPage Engine用于将ICR和OCR技术集成到应用程序中,并提供程序员强大,高性能,可扩展的图像识别解决方案。

LEADTOOLS Recognition Imaging Developer Toolkit

条码图像识别开发包,帮您创建端到端文档图像应用程序的企业级文档自动化解决方案

LEADTOOLS PACS Imaging Developer Toolkit

开发功能强大的PACS Imaging应用程序的最佳选择

LEADTOOLS MPEG-2 Transport Module

包含DirectShow过滤器,用于创建和播放MPEG-2 传输和MPEG-2程序流,此外并能够从RTSP服务器产生流数据。

LEADTOOLS DVR SDK Module For Multimedia

LEADTOOLS Multimedia Suite Developer Toolkit

LEADTOOLS Multimedia SDK是专为开发各种跨行业音频/视频应用程序所设计的多媒体开发工具包。

LEADTOOLS Barcode Pro Developer Toolkit

一款全面的可读写1D和2D条形码的软件开发工具包。

LEADTOOLS PDF Pro

LEADTOOLS PDF Pro 具备浏览光栅图与编辑PDF文件所需的所有功能。

LEADTOOLS OCR Module - OmniPage Engine with Additional Languages

OCR Module - OmniPage Engine with Additional Languages用于将阿拉伯语,中文,日语和韩语光学字符识别(OCR)技术集成到应用程序。

在线
客服
咨询
电话
400-700-1020
在线
QQ
购物车 反馈 返回
顶部
在线客服系统
live chat