扫描识别工具Dynamic Web TWAIN使用教程:OCR(上)

翻译|使用教程|编辑:黄竹雯|2019-03-18 16:20:56.000|阅读 25 次

概述:在文档数字化的过程中,经常需要从所获取的图像中提取所需的信息。光学字符识别(OCR)是可以实现此需求的技术。在本文中,我们将探讨如何使用Dynamic Web TWAIN及其OCR加载项在浏览器中快速扫描和识别文本。

相关链接:

Dynamic Web TWAIN是一个专为Web应用程序设计的TWAIN扫描识别控件。你只需在TWAIN接口写几行代码,就可以用兼容TWAIN的扫描仪扫描文档或从数码相机/采集卡中获取图像。然后用户可以编辑图像并将图像保存为多种格式, 用户可保存图像到远程数据库或者SharePoint。这个TWAIN控件还支持上传和处理本地图像。

Dynamic Web TWAIN最新版免费下载>>>

在Web应用程序中快速实现文本识别

介绍

在文档数字化的过程中,经常需要从所获取的图像中提取所需的信息。光学字符识别(OCR)是可以实现此需求的技术。在本文中,我们将探讨如何使用Dynamic Web TWAIN及其OCR加载项在浏览器中快速扫描和识别文本。

请注意:在本文我们只讨论基础的OCR引擎,我们将在客户端使用它。引擎也可以在服务器端使用。

环境

OCR模块本身不依赖于Node.js,本文中需要它只是因为使用其包管理器(npm)获取所需文件的速度更快。

步骤

步骤1 创建一个新目录,打开命令行工具(快捷键是Ctrl + Shift +右键单击)。通过npm下载本文中使用的核心控件

npm install dwt@14.2.0

然后,你可以在此目录中看到以下内容

目录1

步骤2 打开以下目录

node_modules\dwt\sample

在此你可以看到

目录2

步骤3 在本文中,我们将检查OCRADocument.html。双击它打开。如果相关控件尚不可用,请按照提示进行安装

安装提示

在正常情况下,可以在C:\Windows\SysWOW64\Dynamsoft\DynamsoftService目录中找到已安装的文件。这里的核心文件主要是:

  • DynamsoftService.exe
  • dwt_trial_14.1.0.0828.dll
  • DynamicOCR.dll
  • /DynamicOCR/

步骤4 安装完成后,刷新页面,单击Scan Documents(本地需要扫描仪)或Load Images or PDFs以扫描或加载带有英文文本的本地图像文件。然后单击OCR An Image with English。 然后,图像的识别结果将显示在右侧的结果框中

识别结果

下一篇文章将与大家分享如何实现上述功能,敬请期待~


想要购买正版授权,或者获取更多Dynamic Web TWAIN相关信息的朋友可以点击" 咨询在线客服 "~


标签:扫描识别图像处理扫描与图像

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动成果

文章转载自: https://www.dynamsoft.com/docs/dwt/Dev-Guide/Scan-OCR-Basic.html

登录慧都网发表评论登录


暂无评论...

为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
相关厂商
相关产品
Stimulsoft Reports.Silverlight

Stimulsoft Reports.Silverlight是一个基于Silverlight平台的报表创建工具。

在线客服 在线QQ 电话咨询
400-700-1020
在线客服系统
live chat