PDF处理控件Aspose.PDF功能演示:使用 Java 从 PDF 表格中提取数据

原创|使用教程|编辑:张莹心|2021-10-22 10:38:16.973|阅读 37 次

概述:PDF是当今的裁决文件格式之一。它支持文本、图形、表格、注释和一系列其他元素。在某些情况下,您可能需要从 PDF 文档(如发票)中的表格中提取数据。为了以编程方式实现这一点,本文介绍了如何使用 Java 从 PDF 表格中提取数据。

# 31款JAVA开发必备控件和工具 # 开发软/控件产品年终优惠

PDF是当今的裁决文件格式之一。它支持文本、图形、表格、注释和一系列其他元素。在某些情况下,您可能需要从 PDF 文档(如发票)中的表格中提取数据。为了以编程方式实现这一点,本文介绍了如何使用 Java 从 PDF 表格中提取数据。

  • 从 PDF 表格中提取数据的 Java API
  • 从 PDF 表格中提取数据
  • 从页面的特定区域提取表格

为了从 PDF 表格中提取数据,我们将使用Aspose.PDF for Java,它是一个功能丰富的 API,用于在 Java 应用程序中创建、处理和转换 PDF 文件。感兴趣的朋友可点击下方按钮下载最新版。

点击下载最新版Aspose.PDF for Java

PDF处理控件Aspose.PDF功能演示:使用 Java 从 PDF 表格中提取数据

从 PDF 表格中提取数据的 Java API

Aspose.PDF for Java是一个功能丰富的 API,用于创建和操作 PDF 文档。我们将使用此 API 从 PDF 文档的表格中提取数据。您可以  使用以下Maven 配置下载API 的 JAR 或将其安装在您的 Java 应用程序中 。

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-pdf</artifactId>
    <version>21.9</version>
</dependency>

使用 Java 从 PDF 表格中提取数据

以下是使用 Java 从 PDF 中的表格中提取数据的步骤。

  • 首先,使用Document类加载 PDF 文档。
  • 使用Document.getPages()集合遍历 PDF 中的页面。
  • 在每次迭代中,初始化TableAbsorber对象并使用TableAbsorber.visit(Page)方法访问所选页面。
  • 在嵌套循环中,遍历TableAbsorber.getTableList()集合中的表列表。
  • 对于集合中的每个AbsorbedTable,遍历来自AbsorbedTable.getRowList()的行集合。
  • 对于集合中的每个AbsorbedRow,遍历来自AbsorbedRow.getCellList()的单元格集合。
  • 最后,遍历TextFragment每个集合AbsorbedCell和打印文本。

从 PDF 页面的特定区域提取表格

以下是使用 Java 从 PDF 页面的特定部分提取表格的步骤。

  • 首先,使用Document类加载 PDF 文档。
  • 然后,从Document.getPages()集合中选择所需的页面。
  • 提取页面的 Square 注释。
  • 在每次迭代中,初始化TableAbsorber对象并使用TableAbsorber.visit(Page)方法访问所选页面。
  • 在嵌套循环中,遍历TableAbsorber.getTableList()集合中的表列表。
  • 检查吸收的表格是否在所需的页面区域中。
  • 对于集合中的每个AbsorbedTable,使用AbsorbedTable.getRowList()遍历行集合。
  • 对于集合中的每个AbsorbedRow,使用AbsorbedRow.getCellList()遍历单元格集合。
  • 最后,遍历TextFragment每个集合AbsorbedCell和打印文本。

如果你想试用Aspose的全部完整功能,可联系在线客服获取30天临时授权体验。


还想要更多吗?您可以点击阅读【Aspose最新资源在线文库】查找需要的教程资源。如果您有任何疑问或需求,请随时加入Aspose技术交流群(761297826),我们很高兴为您提供查询和咨询

标签:

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至hey@evget.com


为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
在线咨询
联系我们
TOP
在线客服系统
live chat