|
Aspose API支持流行文件格式处理,并允许将各类文档导出或转换为固定布局文件格式和最常用的图像/多媒体格式。
Aspose.Words For .NET是一种高级Word文档处理API,用于执行各种文档管理和操作任务。API支持生成,修改,转换,呈现和打印文档,而无需在跨平台应用程序中直接使用Microsoft Word。此外,API支持所有流行的Word处理文件格式,并允许将Word文档导出或转换为固定布局文件格式和最常用的图像/多媒体格式。
在各种情况下,您需要在 Web 或桌面应用程序中显示 Word DOC 文件的内容。在这种情况下,合适的选项之一是将DOC转换为HTML。为了在 .NET 应用程序中实现这一点,本文介绍了如何在 C# 中将 DOC 文件转换为 HTML。此外,您将学习如何使用不同的选项动态控制 DOC 到 HTML 的转换。
---------------------------------Aspose技术交流群(761297826)----------------------------
一、 下载 DOC 转 HTML 的 C# API
要在 .NET 应用程序中执行 DOC 到 HTML 的转换,我们将使用Aspose.Words for .NET。它是一个功能强大的类库,可让您创建和操作 Word 文档。此外,它还允许您将 DOC 文档转换为各种其他文件格式。您可以下载API 或使用NuGet安装它。
PM> Install-Package Aspose.Words二、在 C# 中将 DOC 转换为 HTML
Aspose.Words for .NET 使您可以更轻松地将 DOC 文档转换为 HTML。只需加载 DOC 文件并将其保存为 HTML 文件。以下是在 C# 中将 DOC 文件转换为 HTML 的步骤。
- 使用Document类加载 DOC 文件。
- 使用Document.Save(string, SaveFormat)方法将 DOC 转换为 HTML 。
以下代码示例展示了如何使用 C# 将 DOC 文件转换为 HTML。
// Load the document from disk
Document doc = new Document("Document.docx");
// Save the document as HTML
doc.Save("Document.html", SaveFormat.Html);三、C# 自定义 DOC 到 HTML 的转换
Aspose.Words for .NET 还允许您使用不同的选项自定义 DOC 到 HTML 的转换。例如,您可以指定一个文件夹来分别保存资源文件(CSS、字体和图像)。此外,您可以导出文档的往返信息。以下部分演示了如何使用这些选项。
C# DOC to HTML - 导出往返信息
MS Word 提供了广泛的功能,但并非所有这些功能都受 HTML 支持。因此,为了使 HTML 的内容接近原始文档,使用了往返信息。以下步骤显示如何将 DOC 中的往返信息导出到 C# 中的 HTML 转换。
- 使用Document类加载 DOC 文档。
- 创建HtmlSaveOptions类的对象。
- 使用HtmlSaveOptions.ExportRoundtripInformation属性启用往返信息的导出。
- 使用Document.Save(string, HtmlSaveOptions)方法将 DOC 文档转换为 HTML 。
以下代码示例显示如何将 C# DOC 中的往返信息导出到 HTML 转换。
// Load the document from disk
Document doc = new Document("Document.docx");
// Enable roundtrip information
HtmlSaveOptions options = new HtmlSaveOptions();
options.ExportRoundtripInformation = true;
// Save as HTML
doc.Save("ExportRoundtripInformation_out.html", options);C# 中的 DOC 到 HTML - 指定资源文件夹
在执行 DOC 到 HTML 的转换时,您可以将资源文件保存在单独的文件夹中。此外,您可以指定文件夹以分别保存字体和图像。以下是实现此目的的步骤。
- 使用Document类加载 DOC 文档。
- 创建HtmlSaveOptions类的对象。
- 使用HtmlSaveOptions.ResourceFolder属性设置资源文件夹。
- 使用Document.Save(string, HtmlSaveOptions)方法将 DOC 文档转换为 HTML 。
以下代码示例展示了如何在 C# 中将 DOC 转换为 HTML 时将资源保存在单独的文件夹中 。
// Load document
Document doc = new Document("document.docx");
// Set folder for resources
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.External;
saveOptions.ExportFontResources = true;
saveOptions.ResourceFolder = dataDir + @"\Resources";
saveOptions.ResourceFolderAlias = "http://example.com/resources";
// Convert document to HTML
doc.Save("ExportResourcesUsingHtmlSaveOptions.html", saveOptions);以上便是如何使用不同的选项动态控制 DOC 到 HTML 的转换详细步骤 ,要是您还有其他关于产品方面的问题,欢迎咨询我们,或者加入我们官方技术交流群。 |
|