Html to xml net

Преобразование HTML в XML через C#

Преобразование HTML в XML в C#. Программисты могут использовать этот пример кода для экспорта HTML в XML в любой платформе.NET Framework, .NET Core, .NET 5-7

Преобразование HTML в XML в .NET

Как преобразовать HTML в XML? Вы можете легко программно преобразовать документ из формата HTML в формат XML с помощью современного API обработки документов .NET. Используйте всего несколько строк кода на языке С# для высококачественной конвертации файлов. Библиотека Aspose.PDF позволит любому разработчику эффективно решать задачи преобразования HTML в XML с помощью .NET.

Более подробное описание фрагмента кода и других возможных форматов преобразования см. на страницах Документация. Кроме того, вы можете проверить другие конверсии форматов, которые поддерживаются нашей библиотекой.

Читайте также:  Css border color top bottom

Чтобы преобразовать HTML в XML, мы будем использовать API Aspose.PDF для .NET, который представляет собой многофункциональный, мощный и простой в использовании API преобразования для платформы.NET. Ознакомьтесь с подробностями установки библиотеки на страницах Документация. Чтобы убедиться в преимуществах библиотеки, попробуйте использовать фрагмент кода, преобразованный HTML в XML. Можно также использовать следующую команду из консоли диспетчера пакетов:

PM > Install-Package Aspose.PDF

Как преобразовать HTML в XML

Разработчики .NET могут легко загружать и конвертировать файлы HTML в XML всего за несколько строк кода.

  1. Инициализация нового документа
  2. Вызовите метод Document.Save, передав путь к выходному файлу & SaveFormat.Xml в качестве параметров
  3. XML-файл будет сохранен по указанному пути

Системные требования

Aspose.PDF для .NET поддерживается во всех основных операционных системах. Просто убедитесь, что у вас есть следующие предпосылки.

  • Microsoft® Windows™ или совместимая ОС с платформой .NET Framework, .NET Core и PHP, VBScript, Delphi, C++ через COM Interop.
  • Среда разработки, такая как Microsoft Visual Studio.
  • Aspose.PDF для DLL .NET, на которую ссылается ваш проект.

Вот пример, демонстрирующий, как преобразовать HTML в XML в C#. Чтобы преобразовать файл HTML в формат XML, выполните следующие простые шаги. Сначала загрузите файл HTML, а затем просто сохраните его как файл XML. Можно использовать полные имена файлов как для чтения HTML, так и для записи XML. Выходное содержимое и форматирование XML будут идентичны исходному документу HTML.

Пример: Преобразование HTML в XML с помощью C#

Этот пример кода показывает преобразование HTML в XML на C#

 public static void ConvertHTMLtoXML()    // load HTML with an instance of Document  var document = new Document("template.html", new HtmlLoadOptions());   // save document in XLS format  document.Save("output.xml", Aspose.Pdf.SaveFormat.Xml);  > 

Источник

How to Convert HTML to XML in C#, VB.NET

Office OpenXML becomes the technology of choice for delivering structured data on the Web, working hand-in-hand with HTML and fully complementing HTML. Consequently, we need to convert HTML to Office OpenXML at some point at work. This article mainly talks about the conversion process through a professional Word .NET library Spire.Doc.

First we need to complete the preparatory work before the procedure:

  • Download the Spire.Doc and install it on your machine.
  • Add the Spire.Doc.dll files as reference.
  • Open bin folder and select the three dll files under .NET 4.0.
  • Right click property and select properties in its menu.
  • Set the target framework as .NET 4.
  • Add Spire.Doc as namespace.

The following steps will show you how to do this with ease:

Step 1: Create a Word document.

Document doc = new Document();

Step 2: Load the HTML file.

doc.LoadFromFile("Sample.html");

Step 3: Save the HTML as the XML file.

doc.SaveToFile("test.xml", FileFormat.Xml);

Here comes to the full C# and VB.NET code

using Spire.Doc; namespace HTMLXML < class Program < static void Main(string[] args) < Document doc = new Document(); doc.LoadFromFile("Sample.html"); doc.SaveToFile("test.xml", FileFormat.Xml); >> >
Imports Spire.Doc Namespace HTMLXML Class Program Private Shared Sub Main(args As String()) Dim doc As New Document() doc.LoadFromFile("Sample.html") doc.SaveToFile("test.xml", FileFormat.Xml) End Sub End Class End Namespace

Preview of original HTML file.

HTML_effect_screenshot

Preview of generated Office OpenXML file.

XML_effect_screenshot

See Also

Источник

Convert HTML to XML in C#

HTML to XML conversion with a few lines of .NET code

GroupDocs.Conversion

About GroupDocs.Conversion for .NET API

GroupDocs.Conversion for .NET can be used to convert Microsoft Word, Excel, PowerPoint, PDF, Visio and other formats. GroupDocs.Conversion is a standalone API that is suitable for back-end and internal systems where high performance is required. It does not depend on any software such as Microsoft or Open Office.

Convert your HTML files to XML in .NET easily. You can use just a couple of C# code lines in any platform of your choice like — Windows, Linux, macOS. You can try HTML to XML conversion for free and evaluate conversion results quality. Along with simple file conversion scenarios you can try more advanced options for loading source HTML file and for saving output XML result.

For example, for the source HTML file you may use the following load options:

  • auto-detect file format;
  • specify password for protected files (if file format supports it);
  • replace missing fonts to preserve document appearance.

There are also advanced convert options for the XML file:

  • convert specific document page or page range;
  • add a watermark to the converted XML file and many more.

Once conversion is completed you can save your XML file to the local file path or any third-party storage like FTP, Amazon S3, Google Drive, Dropbox etc. Please note — to convert HTML to XML there is no need for any additional software installed — like MS Office, Open Office, Adobe Acrobat Reader etc.

Steps to convert HTML to XML in C#

GroupDocs.Conversion for .NET makes it easy for developers to convert a HTML file to XML with a few lines of code.

  • Create an instance of the Converter class and provide the file HTML with the full path
  • Create and set ConvertOptions for XML type.
  • Call the Converter.Convert method and pass the full path and format (XML) as a parameter

System Requirements

Basic conversion with GroupDocs.Conversion for .NET can be done in just a few simple steps. Our APIs are supported on all major platforms and operating systems. Before executing the code below, make sure you have the following prerequisites installed on your system.

  • Operating systems: Microsoft Windows, Linux, MacOS
  • Development environments: Microsoft Visual Studio, Xamarin, MonoDevelop
  • Frameworks: .NET Framework, .NET Standard, .NET Core, Mono
  • Get the latest GroupDocs.Conversion for .NET from Nuget
// Load HTML file var converter = new GroupDocs.Conversion.Converter("input.html"); // Set conversion parameters for XML format var convertOptions = converter.GetPossibleConversions()["xml"].ConvertOptions; // Convert to XML format converter.Convert("output.xml", convertOptions); 

HTML to XML Live Demo

Convert HTML to XML now by visiting the GroupDocs.Conversion App website. Online demo has the following advantages

No need to write any code

Just upload the source file

Get download link to save the file

Other supported HTML conversions in C#

You can also convert HTML to many other file formats. Please see the list below.

(Microsoft Word Binary Format)

(Microsoft Word 2007 Marco File)

(Office 2007+ Word Document)

(Microsoft Word Template Files)

(Microsoft Word 2007+ Template File)

(Microsoft Word Template File )

(Graphical Interchange Format)

(Joint Photographic Expert Group Image)

(OpenDocument Text File Format)

(OpenDocument Standard Format)

Источник

Convert HTML to XML via C#

High-speed C# library for converting HTML to XML. Export Excel spreadsheets to XML format on .NET Framework, .NET Core or Mono Platforms.

Aspose.Cells for .NET

Overview

Download from NuGet

Open NuGet package manager, search for and install.
You may also use the following command from the Package Manager Console.

Convert HTML to XML Using C#

How to convert HTML to XML? With Aspose.Cells for .NET library, you can easily convert HTML to XML programmatically with a few lines of code. Aspose.Cells for .NET is capable of building cross-platform applications with the ability to generate, modify, convert, render and print all Excel files. .NET Excel API not only convert between spreadsheet formats, it can also render Excel files as images, PDF, HTML, ODS, CSV, SVG, JSON, WORD, PPT and more, thus making it a perfect choice to exchange documents in industry-standard formats. Open NuGet package manager, search for Aspose.Cells and install. You may also use the following command from the Package Manager Console.

Package Manager Console Command

 PM> Install-Package Aspose.Cells 

Save HTML to XML in C# Online for Free

The following example demonstrates how to convert HTML to XML in C#.

Follow the easy steps to convert HTML to XML. Upload your HTML file, then simply save it as XML file. For both HTML reading and XML writing you can use fully qualified filenames. The output XML content and formatting will be identical to the original HTML document.

Источник

Оцените статью