logo Aspose.PDF使用教程 我也要发布文档

在 C#中以编程方式从 PDF 中提取图像


PDF格式广泛用于创建用于共享和打印的只读文档。通常,PDF 文档包含图像和文本,在某些情况下,可能需要在解析 PDF 时提取这些图像。因此,本文介绍了如何使用 C# 以编程方式从 PDF 中提取图像。

  • 从 PDF 中提取图像

为了从 PDF 中提取图像,我们将使用Aspose.PDF for .NET,它是一个强大的 API,可实现广泛的 PDF 生成和操作功能。此外,它还允许无缝地解析 PDF 并提取图像。点击下方按钮可下载试用。

点击下载最新版Aspose.PDF for .NET

在 C# 中从 PDF 中提取图像

以下是使用 C# 从 PDF 中提取图像的步骤。

  • 使用Document类加载文档。
  • 使用Document.Pages集合遍历 PDF 文档的页面。
  • 对于每个页面,访问Page.Resources.Images集合中的每个XImage。
  • 为每个图像创建一个FileStream对象并将其保存为 JPEG、PNG 等。
  • 最后,关闭FileStream。

以下代码示例展示了如何从 PDF 中提取图像。

// Open document
Document pdfDocument = new Document("candy.pdf");

int imageCounter = 1;

// Loop through pages
foreach (var page in pdfDocument.Pages)
{
    // Loop through all images
    foreach (XImage image in page.Resources.Images)
    {
        // Create file stream for image
        FileStream outputImage = new FileStream(String.Format("Page{0}_Image{1}.jpg", page.Number, imageCounter), FileMode.Create);

        // Save output image
        image.Save(outputImage, ImageFormat.Jpeg);

        // Close stream
        outputImage.Close();

        imageCounter++;
    }

    // Reset counter
    imageCounter = 1;
}

如果您有任何疑问或需求,请随时加入Aspose技术交流群(761297826),我们很高兴为您提供查询和咨询。