没有找到合适的产品?
联系客服协助选型:023-68661681
提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
翻译|使用教程|编辑:胡涛|2022-08-30 10:42:23.883|阅读 173 次
概述:本文将向您展示如何使用 doc.GetText() 的方法直接从包含文本、图像和表格的 word 文档中提取文本。更方便开发者从代码中提取word文档中的文本。
# 界面/图表报表/文档/IDE等千款热门软控件火热销售中 >>
相关链接:
Spire.Doc for .NET是一款专门对 Word 文档进行操作的 .NET 类库。在于帮助开发人员无需安装 Microsoft Word情况下,轻松快捷高效地创建、编辑、转换和打印 Microsoft Word 文档。拥有近10年专业开发经验Spire系列办公文档开发工具,专注于创建、编辑、转换和打印Word/PDF/Excel等格式文件处理,小巧便捷。
有时我们在处理信息量很大的word文档时,只需要从word文档中获取文本以供其他使用。在 Spire.Doc 的帮助下,我们已经演示了如何通过遍历 word 文档中的每个段落然后相应地附加文本来从 word 文档中提取文本。本文将向您展示如何使用 doc.GetText() 的方法直接从包含文本、图像和表格的 word 文档中提取文本。更方便开发者从代码中提取word文档中的文本。
第 1 步:创建一个 word 实例并从文件中加载源 word 文档。
Document doc = new Document(); doc.LoadFromFile("Sample.docx");
第 2 步:调用 doc.GetText() 方法从 word 文档中获取所有文本。
string s = doc.GetText();
第 3 步:创建一个新的 TEXT 文件以保存提取的文本。
File.WriteAllText("Extract.txt", s.ToString());
从word文档中获取所有文本后的有效截图:
完整代码:
using Spire.Doc; using System.IO; namespace GetText { class WordText { public void GetText() { Document doc = new Document(); doc.LoadFromFile("Sample.docx"); string s = doc.GetText(); File.WriteAllText("Extract.txt", s.ToString()); } } }
以上便是如何在C#中获取word文档中的文本,如果您有其他问题也可以继续浏览本系列文章,获取相关教程,你还可以给我留言或者加入我们的官方技术交流群。
欢迎下载|体验更多E-iceblue产品
获取更多信息请咨询慧都在线客服 ;技术交流Q群(767755948)
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@evget.com
本文主要介绍如何使用DevExpress WPF Grid控件实现节点(Nodes)的遍历,欢迎下载最新版组件体验!
AG Grid 是一个与框架无关的数据网格,它为 React、Angular、Vue 和 Vanilla JS 提供官方支持,本文将重点介绍一些可以使用 AG Grid 添加到应用程序的特性和功能的示例,以及现场演示和示例代码。
从 2025.2 版本开始,用于仪表板创建的 Stimulsoft 产品引入了InclusionMode属性,我们将在本文中对其进行探讨。
本文将为大家介绍如何在Telerik UI for WinForms应用中使用Kendo UI for Angular组件来交换通信和事件,欢迎下载新版组件体验!
Spire.Doc for .NET 是一款专门对 Word 文档进行操作的 .NET 类库。
Spire.XLS for .NETSpire.XLS for .NET是专业.NET Excel组件,快速完成对Excel各类编程操作
Spire.Office for .NET专业的.NET Office套件,涵盖office文档创建、编辑、转换、管理和OCR内容识别等操作
Aspose.Words for .NET无需Microsoft Word也可在任何平台上满足Word文档的一切操作需求。
Aspose.PDF for .NETPDF文档创建组件,无需Adobe Acrobat,也可以在任何平台上操作PDF文档。
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@evget.com
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢
慧都科技 版权所有 Copyright 2003-
2025 渝ICP备12000582号-13 渝公网安备
50010702500608号