XML - Расширяемый Язык Разметки (eXtensible Markup Language) рекомендован W3C как язык для обмена информацией между различными системами. Это ориентированный на текст способ сохранения информации. Современные языки обмена данными, такие как XHTML, так же как и большинство технологий WebServices, основаны на XML.

В настоящее время существует ряд модулей для поддержки XML в Free Pascal. Эти модули называются "XMLRead", "XMLWrite" и "DOM" и являются частью Free Component Library (FCL) из компилятора Free Pascal. FCL уже находится в заданном по умолчанию пути поиска файлов для компилятора в Лазарусе, таким образом Вам нужно только добавить названия модулей в строку USES чтобы получить поддержку XML в Вашей программе. Использование XML пока не документировано, поэтому эта статья даёт необходимые вводные сведения для работы с модулями поддержки XML.

DOM XML (Объектная модель документов) это ряд стандартизированных объектов, которые предоставляют однотипный интерфейс для использования XML в различных языках и платформах. Стандарт определяет только методы, свойства и другие части интерфейса объекта, оставляя реализацию свободной для различных языков. FCL в настоящее время поддерживает полностью DOM 1.0.


Ниже находится список примеров работы с XML-данными с растущей сложностью.

Чтение текстового узла

Для Delphi-программистов:

Помните, что когда Вы работаете с TXMLDocument, текст в пределах узла считается отдельным текстовым узлом. Таким образом, Вы должны обратиться к текстовому значению узла, как к отдельному узлу. Альтернативно, свойство TextContent может быть использовано для возврата значения всех узлов лежащих ниже, которые связаны с данным.

Процедура ReadXMLFile всегда создаёт новый TXMLDocument, таким образом Вы не должны создавать его заранее. Однако Вы должны вызывать процедуру Free вручную после окончания работы с документом.

Для примера рассмотрим следующий XML:


<?xml version="1.0"?>


Следующий пример показывает корректный и некорректный способы получения значений текстового узла xml:


 PassNode: TDOMNode;
 Doc:      TXMLDocument;
 // Читаем xml файл с жесткого диска
 ReadXMLFile(Doc, 'c:\xmlfiles\test.xml');
 // Запрашиваем узел с именем "password"
 PassNode := Doc.DocumentElement.FindNode('password');
 // Выводим значение выбранного узла
 WriteLn(PassNode.NodeValue); // вывод будет пустым
 // Текст узла - это отдельный дочерний узел
 WriteLn(PassNode.FirstChild.NodeValue); // правильно выведет "abc"
 // альтернатива
 // В завершении делаем Free Для документа

end; </delphi>

Вывод названий узлов

Маленькое замечание о навигации по дереву DOM:

Когда вам нужен последовательный доступ к узлам, лучшим решением будет использование свойства FirstChild и NextSibling (чтобы шагать вперед по дереву) или LastChild и PreviousSibling (назад с конца дерева). Для свободного доступа к элементам дерева можно пользоваться методами ChildNodes или GetElementsByTagName, но это создаст объект TDOMNodeList, который в конце его использования должен быть освобождён. Этот метод отличается от других DOM реализаций, таких к примеру как MSXML, поскольку FCL реализация базируется на объектах, а не на интерфейсе.

Следующий пример демонстрирует, как выводить имена узлов в компонент TMemo, расположенный на форме.

Ниже приведён XML файл с именем 'C:\Programs\test.xml':


<?xml version="1.0"?>
<images directory="mydir">
 <imageNode URL="graphic.jpg" title="">
   <Peca DestinoX="0" DestinoY="0">Pecacastelo.jpg1.swf</Peca>
   <Peca DestinoX="0" DestinoY="86">Pecacastelo.jpg2.swf</Peca>


И код на Pascal, который выполняет эту задачу:


  Documento: TXMLDocument;
  Child: TDOMNode;
  j: Integer;
  ReadXMLFile(Documento, 'C:\Programas\teste.xml');
  // Используем свойства FirstChild и NextSibling
  Child := Documento.DocumentElement.FirstChild;
  while Assigned(Child) do
    Memo.Lines.Add(Child.NodeName + ' ' + Child.Attributes.Item[0].NodeValue);
    // Используем метод ChildNodes
    with Child.ChildNodes do
      for j := 0 to (Count - 1) do
        Memo.Lines.Add(Item[j].NodeName + ' ' + Item[j].FirstChild.NodeValue);
    Child := Child.NextSibling;


В результате программа выведет следующее:

imageNode graphic.jpg
Peca Pecacastelo.jpg1.swf
Peca Pecacastelo.jpg1.swf

Загрузка XML в TreeView

One common use of XML files is to parse them and show their contents in a tree like format. You can find the TTreeView component on the "Common Controls" tab on Lazarus.

The function below will take a XML document previously loaded from a file or generated on code, and will populate a TreeView with it´s contents. The caption of each node will be the content of the first attribute of each node.

Одним из способов использования файлов XML является разбор и показать их содержимого в виде дерева объектов. Вы можете найти компонент TTreeView на вкладке "Common Controls" Lazarus.

Функция ниже использует документ XML, который был загружен ранее из файла, и заполняет TreeView содержимым XML-документа. Подпись каждого узла будет содержать первый атрибут каждого узла.

<delphi> procedure TForm1.XML2Tree(tree: TTreeView; XMLDoc: TXMLDocument); var

 iNode: TDOMNode;
 procedure ProcessNode(Node: TDOMNode; TreeNode: TTreeNode);
   cNode: TDOMNode;
   s: string;
   if Node = nil then Exit; // выходим, если достигнут конец документа
   // добавляем узел в дерево
   if Node.HasAttributes and (Node.Attributes.Length>0) then
   TreeNode := tree.Items.AddChild(TreeNode, s);
   // переходим к дочернему узлу
   cNode := Node.FirstChild;
   // проходим по всех дочерним узлам
   while cNode <> nil do
     ProcessNode(cNode, TreeNode);
     cNode := cNode.NextSibling;


 iNode := XMLDoc.DocumentElement.FirstChild;
 while iNode <> nil do
   ProcessNode(iNode, nil); // Рекурсия
   iNode := iNode.NextSibling;

end; </delphi>

Изменение XML документа

The first thing to remember is that TDOMDocument is the "handle" to the DOM. You can get an instance of this class by creating one or by loading a XML document.

Nodes on the other hand cannot be created like a normal object. You *must* use the methods provided by TDOMDocument to create them, and latter use other methods to put them on the correct place on the tree. This is because nodes must be "owned" by a specific document on DOM.

Below are some common methods from TDOMDocument:


  function CreateElement(const tagName: DOMString): TDOMElement; virtual;
  function CreateTextNode(const data: DOMString): TDOMText;
  function CreateCDATASection(const data: DOMString): TDOMCDATASection;
  function CreateAttribute(const name: DOMString): TDOMAttr; virtual;


And here an example method that will locate the selected item on a TTreeView and then insert a child node to the XML document it represents. The TreeView must be previously filled with the contents of a XML file using the XML2Tree function.

<delphi> procedure TForm1.actAddChildNode(Sender: TObject); var

 position: Integer;
 NovoNo: TDomNode;


 *  Detects the selected element
 if TreeView1.Selected = nil then Exit;
 if TreeView1.Selected.Level = 0 then
   position := TreeView1.Selected.Index;
   NovoNo := XMLDoc.CreateElement('item');
   TDOMElement(NovoNo).SetAttribute('nome', 'Item');
   TDOMElement(NovoNo).SetAttribute('arquivo', 'Arquivo');
   with XMLDoc.DocumentElement.ChildNodes do
   *  Updates the TreeView
   XML2Tree(TreeView1, XMLDoc);
 else if TreeView1.Selected.Level >= 1 then
   *  This function only works on the first level of the tree,
   *  but can easely modifyed to work for any number of levels

end; </delphi>

Создание TXMLDocument из обычного текста

Given al XML file in MyXmlString, the following code will create it's DOM:

<delphi> Var

 S : TStringStream;
 XML : TXMLDocument;


 S:= TStringStream.Create(MyXMLString);
   ReadXMLFile(XML,S); // Complete XML document
   // Alternatively:
   ReadXMLFragment(AParentNode,S); // Read only XML fragment.

end; </delphi>

Проверка достоверности документа

Since March 2007, DTD validation facility has been added to the FCL XML parser. Validation is checking that logical structure of the document conforms to the predefined rules, called Document Type Definition (DTD).

Here is an example of XML document with a DTD:


 <?xml version='1.0'?>
 <!DOCTYPE root [
 <!ELEMENT root (child)+ >
 <!ELEMENT child (#PCDATA)>
   <child>This is a first child.</child>
   <child>And this is the second one.</child>


This DTD specifies that 'root' element must have one or more 'child' elements, and that 'child' elements may have only character data inside. If parser detects any violations from these rules, it will report them.

Loading such document is slightly more complicated. Let's assume we have XML data in a TStream object:

<delphi> procedure TMyObject.DOMFromStream(AStream: TStream); var

 Parser: TDOMParser;
 Src: TXMLInputSource;
 TheDoc: TXMLDocument;


 // create a parser object
 Parser := TDOMParser.Create;
 // and the input source
 Src := TXMLInputSource.Create(AStream);
 // we want validation
 Parser.Options.Validate := True;
 // assign a error handler which will receive notifications
 Parser.OnError := @ErrorHandler;
 // now do the job
 Parser.Parse(Src, TheDoc);
 // ...and cleanup


procedure TMyObject.ErrorHandler(E: EXMLReadError); begin

 if E.Severity = esError then  // we are interested in validation errors only

end; </delphi>

Генерация файла XML

Below is the complete code to write in a XML file. (This was taken from a tutorial in DeveLazarus blog ) Please, remember DOM and XMLWrite libs in uses clause

<delphi> unit Unit1;

{$mode objfpc}{$H+}



 Classes, SysUtils, LResources, Forms, Controls, Graphics, Dialogs, StdCtrls,
 DOM, XMLWrite;


 { TForm1 }
 TForm1 = class(TForm)
   Button1: TButton;
   Label1: TLabel;
   Label2: TLabel;
   procedure Button1Click(Sender: TObject);
   { private declarations }
   { public declarations }


 Form1: TForm1;


{ TForm1 }

procedure TForm1.Button1Click(Sender: TObject); var

 xdoc: TXMLDocument;                                  // variable to document
 RootNode, parentNode, nofilho: TDOMNode;                    // variable to nodes


 //create a document
 xdoc := TXMLDocument.create;
 //create a root node
 RootNode := xdoc.CreateElement('register');
 Xdoc.Appendchild(RootNode);                           // save root node
 //create a parent node
 RootNode:= xdoc.DocumentElement;
 parentNode := xdoc.CreateElement('usuario');
 TDOMElement(parentNode).SetAttribute('id', '001');       // create atributes to parent node
 RootNode.Appendchild(parentNode);                          // save parent node
 //create a child node
 parentNode := xdoc.CreateElement('nome');                // create a child node
 //TDOMElement(parentNode).SetAttribute('sexo', 'M');     // create atributes
 nofilho := xdoc.CreateTextNode('Fernando');         // insert a value to node
 parentNode.Appendchild(nofilho);                         // save node
 RootNode.ChildNodes.Item[0].AppendChild(parentNode);       // insert child node in respective parent node
 //create a child node
 parentNode := xdoc.CreateElement('idade');               // create a child node
 //TDOMElement(parentNode).SetAttribute('ano', '1976');   // create atributes
 nofilho := xdoc.CreateTextNode('32');               // insert a value to node
 parentNode.Appendchild(nofilho);                         // save node
 .ChildNodes.Item[0].AppendChild(parentNode);       // insert a childnode in respective parent node
 writeXMLFile(xDoc,'teste.xml');                     // write to XML
 Xdoc.free;                                          // free memory



 {$I unit1.lrs}

end. </delphi>

The result will be the XML file below: <xml> <?xml version="1.0"?> <register>

 <usuario id="001">

</register> </xml>

Starting from SVN revision 12582, XML reader is able to process data in any encoding by using external decoders. See XML_Decoders for more details.

According to the XML standard, the encoding attribute in the first line of the XML is optional in case the actual encoding is UTF-8 or UTF-16 (which is detected by presence of the BOM). As of version 0.9.26 of Lazarus, there is an encoding property in a TXMLDocument, but it is ignored. writeXMLFile always uses UTF-8 and doesn´t generate an encoding attribute in first line of the XML file.

