Word处理控件Aspose.Words功能演示:使用 C# 将 DOCX 转换为 HTML

翻译|使用教程|编辑:胡涛|2022-08-15 11:05:51.410|阅读 30 次

概述:本文介绍了如何在 C# 中将 DOCX 文件转换为 HTML。此外,您将学习如何使用不同的选项动态控制 DOCX 到 HTML 的转换。

# 31款JAVA开发必备控件和工具 # 热门开发工具JetBrains系列产品限时优惠中>>

相关链接:

使用 C++ 将 DOCX 转换为 DOC 或将 DOC 转换为 DOCX

在各种情况下,您需要在 Web 或桌面应用程序中显示 Word DOCX 文件的内容。在这种情况下,合适的选项之一是将DOCX转换为HTML。为了在 .NET 应用程序中实现这一点,本文介绍了如何在 C# 中将 DOCX 文件转换为 HTML。此外,您将学习如何使用不同的选项动态控制 DOCX 到 HTML 的转换。

Aspose.Words 最新下载

C# DOCX to HTML Converter API - 免费下载

要在 .NET 应用程序中执行 DOCX 到 HTML 的转换,我们将使用Aspose.Words for .NET。它是一个功能强大的类库,可让您创建和操作 Word 文档。此外,它还允许您将 DOCX 文档转换为各种其他文件格式。您可以下载API 或使用NuGet安装它

PM> Install-Package Aspose.Words
在 C# 中将 DOCX 转换为 HTML
  • Aspose.Words for .NET 使您可以更轻松地将 DOCX 文档转换为 HTML。只需加载 DOCX 文档并将其保存为 HTML 文件。以下是在 C# 中将 DOCX 文件转换为 HTML 的步骤。

    • 使用Document类加载 DOCX 文档。
    • 使用Document.Save(string, SaveFormat)方法将 DOCX 文档转换为 HTML 。

以下代码示例展示了如何使用 C# 将 DOCX 转换为 HTML。

// Load the document from disk
Document doc = new Document("Document.docx");

// Save the document as HTML
doc.Save("Document.html", SaveFormat.Html);
C# 自定义 DOCX 到 HTML 的转换

Aspose.Words for .NET 还允许您使用不同的选项自定义 DOCX 到 HTML 的转换。例如,您可以指定一个文件夹来分别保存资源文件(CSS、字体和图像)。此外,您可以导出文档的往返信息。以下部分演示了如何使用这些选项

C# DOCX to HTML - 导出往返信息

MS Word 提供了广泛的功能,但并非所有这些功能都受 HTML 支持。因此,为了使 HTML 的内容接近原始文档,使用了往返信息。以下步骤展示了如何将 DOCX 中的往返信息导出到 C# 中的 HTML 转换。

  • 使用Document类加载 DOCX 文档。
  • 创建HtmlSaveOptions类的对象。
  • 使用HtmlSaveOptions.ExportRoundtripInformation属性启用往返信息的导出。
  • 使用Document.Save(string, HtmlSaveOptions)方法将 DOCX 文档转换为 HTML 。

以下代码示例显示如何将 DOCX 中的往返信息导出到 C# .NET 中的 HTML 转换。

// Load the document from disk
Document doc = new Document("Document.docx");

// Enable roundtrip information
HtmlSaveOptions options = new HtmlSaveOptions();
options.ExportRoundtripInformation = true;

// Save as HTML
doc.Save("ExportRoundtripInformation_out.html", options);

C# DOCX 到 HTML 转换 - 指定资源文件夹

在执行 DOCX 到 HTML 的转换时,您可以将资源文件保存在单独的文件夹中。此外,您可以指定文件夹以分别保存字体和图像。以下是实现此目的的步骤。

  • 使用Document类加载 DOCX 文档。
  • 创建HtmlSaveOptions类的对象。
  • 使用HtmlSaveOptions.ResourceFolder属性设置资源文件夹。
  • 使用Document.Save(string, HtmlSaveOptions)方法将 DOCX 文档转换为 HTML 。

以下代码示例展示了如何在 C# DOCX 到 HTML 的转换中将资源保存在单独的文件夹中。

// Load document
Document doc = new Document("document.docx");

// Set folder for resources
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.External;
saveOptions.ExportFontResources = true;
saveOptions.ResourceFolder = dataDir + @"\Resources";
saveOptions.ResourceFolderAlias = "http://example.com/resources";

// Convert document to HTML
doc.Save("ExportResourcesUsingHtmlSaveOptions.html", saveOptions);
结论

在本文中,您学习了如何使用 C++ 将 DOCX 文件转换为 DOCX 格式和将 DOC 文件转换为 DOCX 格式。此外,您还了解了如何使用 boost 库批量执行这些转换。Aspose.Words for C++ 提供了一系列附加功能,用于自动执行与 Word 相关的任务。您可以通过访问官方文档详细了解 API 。


欢迎下载|体验更多Aspose产品

获取更多信息请咨询慧都在线客服 或 加入Aspose技术交流群(761297826

标签:

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至hey@evget.com


为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
在线咨询
联系我们

客服热线
023-68661681

QQ客服

意见反馈


添加微信获专业服务

TOP
在线客服系统
live chat