GroupDocs.Parser (产品编号:14120)

构建可从多种文档格式中提取文本和元数据的.NET和Java应用程序。

标签:文档管理GroupDocs

开发商: GroupDocs

当前版本: v18.12

产品类型:控件

产品功能:文档管理

平台语言:

开源水平:不提供源码

用户推荐:

用户评分:

本产品的分类与介绍仅供参考,具体以商家网站介绍为准,如有疑问请来电 023-68661681 咨询。

同类软件推荐:

Xceed Zip for .NET
Xceed Zip for .NET

唯一与所有最新Zip文件格式兼容的Zip库,包括在文件名中支持所有字符的UTF-8和兼容WinZip 12+的LZMA

PDF4NET
PDF4NET

PDF4NET是一种.NET库,它能够对运行中的任意.NET应用程序进行创建、编辑和填充PDF文档。

阅读更多

GroupDocs.Parser for .NET是一个文本提取器API,可从.NET应用程序中提取文档,电子表格,演示文稿,电子邮件和档案中的原始或格式化文本和元数据。

需要培训、定制、外包?请联系我们!企业QQ:800018081 慧都专业技术团队帮助您提高效率,节省成本,降低风险!

关于本产品的分类与介绍仅供参考,精准产品资料以官网介绍为准,如需购买请先行测试。

GroupDocs.Parser产品系列

groupdocs-Parser-net  
GroupDocs.Parser for.NET

适用于Windows Forms,ASP.NET,WPF,WCF和其他基于.NET Framework的应用程序的原生.NET API

groupdocs-Parser-java  
GroupDocs.Parser forJava

用于桌面,Web和其他基于Java SE或EE的应用程序的原生Java API

GroupDocs.Parser for .NET

GroupDocs.Parser for .NET是一个文本提取器API,用于使用C#,ASP.NET和其他.NET技术开发的业务应用程序。它支持从支持格式的文件中提取原始,格式化和结构化文本以及元数据。通过GroupDocs.Parser for .NET,你的应用程序还可以对流行格式(如电子表格,演示文稿,PDF,ZIP存档等)执行受密码保护的文档解析。

总体特性

以下是GroupDocs.Parser for .NET的概述:

总体特性


支持的文件格式

GroupDocs.Parser for .NET支持以下文件格式:

支持的文件格式


平台独立

GroupDocs.Parser for .NET支持以下操作系统,框架和包管理器:

平台独立


GroupDocs.Parser for .NET功能

  • 统计计算单个或多个文件中的Word出现次数

  • 检测受密码保护的XML文档的媒体类型并从中提取文本

  • 从简单PDF文件或PDF包文档中取出文本

  • 从Excel电子表格中收集单元格,行和列中的原始文本或格式化文本

  • 从EPUB,CHM,Markdown和FB2文件中拉出单句或全文

  • 从分析文档中获取文本区域并从支持的文档格式中提取元数据

  • 从电子邮件容器中获取数据(Exchange Web服务器,POP3,IMAP)

  • 使用纯文本格式化程序(简单和ASCII)或使用Markdown Formatter获取文本

  • 从文件或流中提取文本内容而无需安装文档阅读器

  • 以编程方式从电子邮件和附件中获取格式化文本

  • 从PDF表单中提取数据并从PDF或Word文档中获取格式化表

  • 从Word文档中提取原始或HTML格式的文本

  • 摘录EPUB和CHM文件中的目录

  • 从支持的格式获取所有或选定的图像并旋转提取的图像

  • 在文档中搜索简单文本,单词和正则表达式

  • Markdown Formatter支持字体,超链接,标题,列表和表格的格式

  • 使用快速或标准文本提取模式从文档中获取格式化文本

  • 从OneNote文档的单页或多页中抽出文本

  • 从PowerPoint演示文稿中获取格式化文本或从特定幻灯片中删除文本

  • HTML格式化程序支持段落,超链接,字体,标题,列表和表格的格式

  • 拉出文本及其内容结构完整和摘录文档中突出显示的文本

  • 从Zip Archives和OST容器中的文件中取出文本并从数据库容器中提取文本

  • 在文档中搜索和提取突出显示的表达式

  • 使用边,角度和交点执行自定义格式以格式化纯文本


从文档中提取文本

使用GroupDocs.Parser for .NET API从文档中提取文本很简单,只需几行代码即可实现。

提取文本代码

类型 标题 发布时间

更新时间:2019-01-15 16:11:08.000 | 录入时间:2019-01-15 16:08:46.000 | 责任编辑:况鱼杰

登录慧都网发表评论登录


暂无评论...
相关产品
Xceed Zip for .NET

唯一与所有最新Zip文件格式兼容的Zip库,包括在文件名中支持所有字符的UTF-8和兼容WinZip 12+的LZMA

PDF4NET

PDF4NET是一种.NET库,它能够对运行中的任意.NET应用程序进行创建、编辑和填充PDF文档。

DBNetFile

一个ASP.NET文件管理控件,能为文件系统提供基于Web的用户接口

Polar ZIP

Windows应用程序的完整压缩方案。

Polar ZIP for .NET

.NET环境应用程序的完整压缩方案。

相关厂商
在线客服 在线QQ 电话咨询
400-700-1020
反馈
在线客服系统
live chat