XML Tutorial/es

From Lazarus wiki
Jump to navigationJump to search

Deutsch (de) English (en) español (es) français (fr) magyar (hu) Bahasa Indonesia (id) italiano (it) 日本語 (ja) 한국어 (ko) português (pt) русский (ru) 中文(中国大陆) (zh_CN)

Introducción

   El Lenguaje de Marcas Extensible (XML) es recomendado por el W3C y fue creado para el intercambio de información entre sistemas diferentes. Utiliza texto para almacenar la información. Lenguajes modernos de intercambio de datos, como XHTML y muchas tecnologías de servicios WEB están basados en XML.

   Actualmente hay un conjunto de unidades que dan soporte a XML en Free Pascal. Estas unidades son "XMLRead", "XMLWrite" y "DOM" y son parte de la FCL del compilador Free Pascal. las unidades de la FCL están en el ruta de búsqueda por defecto del compilador de Lazarus, por lo que sólo tendrá que añadir las unidades a la cláusula uses para utilizar XML. La FCL no está actualmente documentada completamente (Octubre / 2005), por lo que este breve tutorial tiene por objeto realizar una introducción al acceso a ficheros XML utilizando las unidades mencionadas.

   El Modelo de Objeto de Documento (DOM) de XML es un conjunto normalizado de objetos que proporcionan una interfaz similar para el uso de XML en diferentes lenguajes y sistemas. La norma sólo especifica los métodos, propiedades y otras partes de la interfaz del objeto, dejando la implementación libre para los diferentes ilenguajes. El FCL actualmente apoya plenamente DOM XML 1.0.

Ejemplos

   Lo que sigue son ejemplos de manipulación de datos XML con una complejidad creciente. Las unidades necesarias para compilar los códigos de los ejemplos (y para cualquier otro código con XML) son: DOM, XMLRead, XMLWrite, XMLCfg, XMLUtils, XMLStreaming. Aunque no todas son necesarias para todos los ejemplos.

Leyendo un nodo de texto

   Para programadores Delphi:

   Resaltar que cuándo se trabaja con TXMLDocument, el texto en un nodo es considerado un nodo de Texto separado. Por tanto se accede al texto del nodo en un nodo separado. Alternativamente, la propiedad TextContent puede utilizarse para recuperar el contenido de todos los nodos de texto por debajo de uno dado, concatenados todos ellos.

    El procedimiento ReadXMLFile crea siempre un nuevo objeto TXMLDocument, por lo que no hay que crearlo previamente de forma manual. Hay que asegurarse de destruir el documento llamando a Free cuando ya no lo necesitemos.

    Por ejemplo, veamos el siguiente XML:

 <?xml version="1.0"?>
 <solicitud>
   <tipo_solicitud>PUT_FILE</tipo_solicitud>
   <usuario>123</usuario>
   <contrasenya>abc</contrasenya>
 </solicitud>

   Este ejemplo muestra la forma correcta y la incorrecta para obtener el valor textual de un nodo (no olvides añadir las unidades XMLRead and DOM en la sección uses):

 var
 NodoContra: TDOMNode;
  Doc:      TXMLDocument;
 begin
  try
   // leer archivo XMl desde disco
   ReadXMLFile(Doc, 'prueba.xml');
   // Extraer el nodo "contrasenya"
   NodoContra := Doc.DocumentElement.FindNode('contrasenya');
   // Escribir el valor del nodo elegido
   WriteLn(NodoContra.NodeValue); // estará vacío
   // El texto del nodo es un nodo hijo en este momento
   WriteLn(NodoContra.FirstChild.NodeValue); // Presenta "abc", tal como deseábamos
   // alternativamente
   WriteLn(NodoContra.TextContent);
  finally
   // Y para terminar liberar la memoria que ocupa nuestro objeto Doc
   Doc.Free;
 end;
end;

   Ten en cuenta que ReadXMLFile (...) ignora todos los caracteres de espacios en blanco al analizar un documento. La sección espacios en blanco se describe cómo conservarlos.

Imprimir los nombres de los nodos y atributos

   Brevemente, cómo recorrer el árbol DOM: Cuándo es necasario recorrer los nodos secuencialmente, lo mejor es utilizar las propiedades FirstChild y NextSibling, para avanzar en el árbol y las propiedades LastChild y PreviousSibling para recorrer el árbol de forma inversa. para acceder de forma aleatoria a nodos podemos utilizar los métodos ChildNodes o GetElementsByTagName, con lo que crearemos un objeto TDOMNodeList que debe ser liberado llegado el caso. La implementación DOM de FCL es orientada a objetos, frente a otras, como MSXML, que lo son orientadas a interfaz.

   Este ejemplo muestra cómo mostrar los nombres de los nodos en un TMemo.

   Este es el XML, en el archivo 'prueba.xml':

 <?xml version="1.0"?>
 <imagenes directorio="midir">
  <imagenesNodo URL="grafico.jpg" rotulo="">
    <Trozo DestinoX="0" DestinoY="0">Trozocastillo.jpg1.swf</Trozo>
    <Trozo DestinoX="0" DestinoY="86">Trozocastillo.jpg2.swf</Trozo>
  </imagenesNodo>
 </imagenes>

   Y aquí el código Pascal para realizar el trabajo:

 var
   Documento : TXMLDocument;
   Hijo : TDOMNode;
   j: Integer;
 begin
  try
   ReadXMLFile(Documento, 'prueba.xml');
   Memo.Lines.Clear;
   // usando las propiedades FirstChild y NextSibling
   Hijo := Documento.DocumentElement.FirstChild;
   while Assigned(Hijo) do
   begin
     Memo.Lines.Add(Hijo.NodeName + ' ' + Hijo.Attributes.Item[0].NodeValue);
     // using ChildNodes method
     with Hijo.ChildNodes do
     try
       for j := 0 to (Count - 1) do
         Memo.Lines.Add(format('%s %s (%s=%s; %s=%s)',
 	 [
 	  Item[j].NodeName,
 	  Item[j].FirstChild.NodeValue,
 	  Item[j].Attributes.Item[0].NodeName, // detalles del primer atributo
 	  Item[j].Attributes.Item[0].NodeValue,
 	  Item[j].Attributes.Item[1].NodeName, // detalles del segundo atributo
 	  Item[j].Attributes.Item[1].NodeValue
 	 ]));
     finally
       Free;
     end;
     Hijo := Hijo.NextSibling;
   end;
  finally
   Documento.Free;
  end;
 end;

   El resultado en Memo1 es:

 imagenesNodo: grafico.jpg
 Trozo: Trozocastillo.jpg1.swf (DestinoX=0; DestinoY=0)
 Trozo: PTrozocastillo.jpg2.swf (DestinoX=0; DestinoY=86)

(re)Poblando un TreeView con XML

   Es habitual procesar los archivos XML para mostrar su contenido en forma de árbol. El componente TTreeView se localiza en la pestaña "Common Controls" de Lazarus.

   El código que se muestra toma un documento XML, previamente leído desde un archivo o generado por código, y con su contenido crea un árbol, en un TreeView. La etiqueta de cada nodo será el contenido del primer atributo de cada nodo XML.

 procedure TFormulario1.XML2Arbol(arbol: TTreeView; XMLDoc: TXMLDocument);
 var
  iNodo: TDOMNode;

  procedure ProcesaNodo(Nodo: TDOMNode; NodoArbol: TTreeNode);
  var
    cNodo: TDOMNode;
    s: string;
  begin
    if Nodo = nil then Exit; // Parar
    
    // Añadir nodo al árbol, si tiene atributos
     
      if Nodo.HasAttributes and (Nodo.Attributes.Length>0) then
         s:=Nodo.Attributes[0].NodeValue
      else
        s:=''; 
      TreeNode := tree.Items.AddChild(TreeNode, s);

    // ir al nodo hijo
    cNodo := Nodo.FirstChild;

    // Procesar todos los nodos hijos
    while cNodo <> nil do
    begin
      ProcesaNodo(cNodo, NodoArbol;
      cNodo := cNodo.NextSibling;
    end;
  end;
    
 begin
  iNodo := XMLDoc.DocumentElement.FirstChild;
  while iNodo <> nil do
  begin
    ProcesaNodo(iNodo, nil); // Recursivo
    iNodo := iNodo.NextSibling;
  end;
 end;

   Otro ejemplo que muestra la estructura completa de XML con todos los valores de atributos::

 procedure XML2Tree(XMLDoc:TXMLDocument; TreeView:TTreeView);
 
  // función local que extrae como texto todos los atributos de los nodos 
  function GetNodeAttributesAsString(pNode: TDOMNode):string;
  var i: integer;
  begin
    Result:='';
    if pNode.HasAttributes then
      for i := 0 to pNode.Attributes.Length -1 do
        with pNode.Attributes[i] do
          Result := Result + format(' %s="%s"', [NodeName, NodeValue]);
 
    // Quita los epacios de principio y final
    Result:=Trim(Result);
  end;
 
  // Funcion recursiva que procesa un nodo y todos su nodos hijos
  procedure ParseXML(Node:TDOMNode; TreeNode: TTreeNode);
  begin
    // Salir del procedimiento si no hay nodos para procesar
    if Node = nil then Exit;
 
    // Añadir el nodo al arbol (TreeView)
    TreeNode := TreeView.Items.AddChild(TreeNode,Trim(Node.NodeName+' '+GetNodeAttributesAsString(Node)+ Node.NodeValue));
 
    // Procesar todos los nodos hijos
    Node := Node.FirstChild;
    while Node <> Nil do
    begin
      ParseXML(Node, TreeNode);
      Node := Node.NextSibling;
    end;
  end;
 
 begin
  TreeView.Items.Clear;
  ParseXML(XMLDoc.DocumentElement,nil);
 end;

Modificando un documento XML

   La primera cuestión que hay que recordar es que un TDOMDocument es un manejador del DOM. Podemos obtener una instancia, un objeto, de esta clase creando una explícitamente o bien cargando un documento XML.

   Para crear nodos XML se deben utilizar los métodos provistos por TDOMDocument y trás ello utilizar el método adecuado para ubicar el nodo en el sitio deseado en el árbol XML. Esto se debe a que un nodo debe ser propiedad de un documento concreto del DOM.

   A continuación se presentan algunos métodos comunes de TDOMDocument:

 function CreateElement(const EtiquetaNombre: DOMString): TDOMElement; virtual;
 function CreateTextNode(const Datos: DOMString): TDOMText;
 function CreateCDATASection(const Datos: DOMString): TDOMCDATASection; virtual;
 function CreateAttribute(const nombre: DOMString): TDOMAttr; virtual;

   CreateElement crea un nodo nuevo.

   CreateTextNode crea un valor par un nodo.

   CreateAttribute crea un atributo dentro de un nodo.

   CreateCDATA crea una sección CDATA: Los caracteres habituales de marca de XML cómo <> no se interpretan dentro de la sección CDATA. Ver artículo sobre CDATA en la Wikipedia

   Un método más adecuado para manipular atributos es utilizar el método TDOMElement.SetAttribute, que también se presenta como la propiedad predeterminada de TDOMElement:

 // Estos dos elementos son equivalentes
Element.SetAttribute('nombre', 'valor');
Element['nombre'] := 'valor';

   Este es un ejemplo de cómo ubicar el elemento seleccionado en un TTreeView e insertar el nodo hijo que representa en el documento XML. El árbol debe ser previamente cumplimentado con el contenido del archivo XML utilizando la función XML2Tree.

 procedure TForm1.actAnyadeNodoHijo(Remitente: TObject);
 var
  posicion: Integer;
  NeoNodo: TDomNode;
 begin
  {*******************************************************************
  *  Hallar el elemento seleccionado
  *******************************************************************}
  if TreeView1.Selected = nil then Exit;

  if TreeView1.Selected.Level = 0 then
  begin
    posicion := TreeView1.Selected.Index;

    NeoNodo := XMLDoc.CreateElement('elemento');
    TDOMElement(NovoNo).SetAttribute('nombre', 'Elemento');
    TDOMElement(NovoNo).SetAttribute('archivo', 'Archivo');
    with XMLDoc.DocumentElement.ChildNodes do
    begin
      Item[position].AppendChild(NeoNodo);
      Free;
    end;

    {*******************************************************************
    *  Actualiza el árbol TreeView1
    *******************************************************************}
    TreeView1.Items.Clear;
    XML2Tree(TreeView1, XMLDoc);
  end
  else if TreeView1.Selected.Level >= 1 then
  begin
    {*******************************************************************
    *  Esta función únicamente trabaja en el primer nivel del árbol.
    *  pero puede ser fácilmente modificada para que lo haga en cualesquiera niveles
    *******************************************************************}
  end;
 end;

Crear un TXMLDocument desde una cadena de caracteres

   Si MiCadenaXML contiene un documento XML, el código siguiente creará su DOM:

 Var
 Cadena: TStringStream;
 XML : TXMLDocument;

 begin
  Cadena:= TStringStream.Create(MiCadenaXML );
  Try
    Cadena.Position:=0;
    XML:=Nil;
    ReadXMLFile(XML,Cadena); // El documento XML completo
    // Alternatively:
    ReadXMLFragment(UnNodoPadre,Cadena); // Lee únicamente un fragmento del XML
  Finally
    Cadena.Free;
  end;
 end;

Validando un documento

   Desde marzo de 2007, la validación con DTD se ha añadido al analizador XML de la FCL. La validación verifica que la estructura lógica del documento se ajusta a las normas definidas en el DTD (Definición de Tipo de Documento) correspondiente.

   Este es un ejemplo de un documento XML con DTD:

 <?xml version='1.0'?>
 <!DOCTYPE raiz [
 <!ELEMENT raiz (child)+ >
 <!ELEMENT hijo (#PCDATA)>
 ]>
 <raiz>
   <hijo>Este es el primer hijo.</hijo>
   <hijo>Y este el segundo.</hijo>
 </raiz>

   Este DTD especifica que el elemento 'raiz' puede tener uno o más elementos 'hijo', y que estos, los elementos 'hijo', únicamente pueden contener caracteres de datos. Si el analizador informa si detecta alguna violación de estas reglas .

   Cargar un documento de esta forma es un poco más complicado. Supongamos que tenemos datos XML en un objeto TStream:

 procedure TMiObjeto.DOMdesdeFlujo(unFlujo: TStream);
 var
  Analizador : TDOMParser;
  Fuente : TXMLInputSource;
  Doc : TXMLDocument;
 begin
  try
   // creamos el objeto analizador
   Analizador := TDOMParser.Create;
   // y la fuente de entrada
   Fuente := TXMLInputSource.Create(unFlujo);
   // ahora validamos
   Analizador.Options.Validate := True;
   // asignamos un manejador de errores pra recibir las notificaciones
   Analizador.OnError := @ErrorHandler;
   // realizamos el trabajo
   Analizador.Parse(Fuente, Doc);
   // ...y hacemos limpieza (general)
  finally
   Fuente.Free;
   Analizador.Free;
  end;
 end;

 procedure TMiObjeto.ErrorHandler(Error: EXMLReadError);
 begin
  if Error.Severity = esError then  // únicamente nos interesan los errores de validación
    writeln(Error.Message);
 end;

Espacios en Blanco

   Si deseas conservar los espacios en blanco al principio de los textos de un nodo, el método anterior es la forma de cargar el documento XML. Los espacios en blanco iniciales son ignorados por defecto. Esta es la razón por la cual la función ReadXML (...) nunca devuelve los espacios en blanco en textos nodo.    Antes de llamar a Analizador.Parse(Fuente, Doc) inserta la línea

 Analizador.Options.PreserveWhitespace := True;

   Esto obliga a que el analizador devuelva todos los espacios en blanco. ¡Esto incluye también los caracteres de nueva línea que existen en un documento XML para que sea más fácil de leer!

Creando un documento XML

   A continuación se muestra el código completo para crear un documento XML y escribirlo en un archivo.

   (Esto está tomado de un tutorial del blog DeveLazarus)

   Recuerda poner en la cláusula uses las unidades DOM y XMLWrite

 unit Unidad1;

 {$mode objfpc}{$H+}

 interface

 uses
  Classes, SysUtils, LResources, Forms, Controls, Graphics, Dialogs, StdCtrls,
  DOM, XMLWrite;

 type
  { TForm1 }
  TForm1 = class(TForm)
    Boton1: TButton;
    Etiqueta1: TLabel;
    Etiqueta2: TLabel;
    procedure Boton1Click(Originador: TObject);
  private
    { declaraciones privadas}
  public
    { declaraciones publicas }
  end;
  
 var
  Form1: TForm1;
  
 implementation

 { TForm1 }

 procedure TForm1.Boton1Click(Originador : TObject);
 var
  xdoc: TXMLDocument;                                  // variable objeto documento XML
  NodoRaiz, NodoPadre, NodoHijo: TDOMNode;                    // variables a los nodos
 begin
  //crear el documento
  xdoc := TXMLDocument.create;

  NodoRaiz := xdoc.CreateElement('registrar');      //crear el nodo raíz
  Xdoc.Appendchild(NodoRaiz);                           // guardar nodo raíz

  NodoRaiz := xdoc.DocumentElement;   //crear el nodo padre
  NodoPadre := xdoc.CreateElement('usuario');
  TDOMElement(NodoPadre).SetAttribute('id', '001');       // crear los atributos del nodo padre
  NodoRaiz.Appendchild(NodoPadre);                          // guardar nodo padre

  NodoPadre := xdoc.CreateElement('nombre');                // crear el nodo hijo
  //TDOMElement(NodoPadre).SetAttribute('sexo', 'M');     // crear los atributos
  NodoHijo := xdoc.CreateTextNode('Fernando');         // insertar el valor del nodo
  NodoPadre.Appendchild(NodoHijo);                         // guardar nodo
  NodoRaiz.ChildNodes.Item[0].AppendChild(NodoPadre);       // insertar el nodo hijo en el correspondiente nodo padre

  NodoPadre := xdoc.CreateElement('edad');               // crear el nodo hijo
  //TDOMElement(NodoPadre).SetAttribute('anyo', '1976');   // crear los atributos
  NodoHijo := xdoc.CreateTextNode('32');               // insertar el valor del nodo
  NodoPadre.Appendchild(NodoHijo);                         // guardar nodo
  NodoRaiz.ChildNodes.Item[0].AppendChild(NodoPadre);       // insertar el nodo hijo en el correspondiente nodo padre

  writeXMLFile(xDoc,'prueba.xml');                     // escribir el XML
  Xdoc.free;                                          // liberar la memoria
 end;

 initialization
  {$I unit1.lrs}

 end.

   El resultado es el documento XML siguiente:

 <?xml version="1.0"?>
 <registrar>
  <usuario id="001">
    <nombre>Fernando</nombre>
    <edad>32</edad>
  </usuario>
 </registrar>

   Un ejemplo en el que no necesitamos referirnos a los elementos por su índice.

 procedure TForm1.Button2Click(Sender: TObject);
 var
   Doc: TXMLDocument;
   RootNode, ElementNode,ItemNode,TextNode: TDOMNode;
   i: integer;
 begin
   try
     // Crear el documento
     Doc := TXMLDocument.Create;
     // Crear el nodo raiz
     RootNode := Doc.CreateElement('Root');
     Doc.Appendchild(RootNode);
     RootNode:= Doc.DocumentElement;
     // Crear los nodos
     for i := 1 to 20 do
       begin
         ElementNode:=Doc.CreateElement('Element');
         TDOMElement(ElementNode).SetAttribute('id', IntToStr(i));
         ItemNode:=Doc.CreateElement('Item1');
         TDOMElement(ItemNode).SetAttribute('Attr1', IntToStr(i));
         TDOMElement(ItemNode).SetAttribute('Attr2', IntToStr(i));
         TextNode:=Doc.CreateTextNode('Item1Value is '+IntToStr(i));
         ItemNode.AppendChild(TextNode);
         ElementNode.AppendChild(ItemNode);
         
         ItemNode:=Doc.CreateElement('Item2');
         TDOMElement(ItemNode).SetAttribute('Attr1', IntToStr(i));
         TDOMElement(ItemNode).SetAttribute('Attr2', IntToStr(i));
         TextNode:=Doc.CreateTextNode('Item2Value is '+IntToStr(i));
         ItemNode.AppendChild(TextNode);
         ElementNode.AppendChild(ItemNode);
         
         RootNode.AppendChild(ElementNode);
       end;
       // Guardar el XML
       WriteXMLFile(Doc,'TestXML_v2.xml');
     finally
     Doc.Free;
   end;

    Este es el documento XML generado:

 <?xml version="1.0"?>
 <Root>
  <Element id="1">
   <Item1 Attr1="1" Attr2="1">Item1Value is 1</Item1>
   <Item2 Attr1="1" Attr2="1">Item2Value is 1</Item2>
  </Element>
  <Element id="2">
   <Item1 Attr1="2" Attr2="2">Item1Value is 2</Item1>
   <Item2 Attr1="2" Attr2="2">Item2Value is 2</Item2>
  </Element>
  <Element id="3">
   <Item1 Attr1="3" Attr2="3">Item1Value is 3</Item1>
   <Item2 Attr1="3" Attr2="3">Item2Value is 3</Item2>
  </Element>
 </Root>

--Mdalacu 15:15, 18 Agosto 2011 (CEST)

Codificación

   A partir de la revisión SVN 12582, XML reader es capaz de procesar los datos en cualquier codificación mediante el uso de decodificadores externos. Ver Decodificadores XML para más detalles.

   Según la norma XML puede haber un atributo de codificación en la primera línea del XML, pero no es obligatorio. La codificación actual es UTF-8(se presumes sin BOM - Marca de Orden de Byte) o UTF-16 (UTF-16 BOM).

   Desde la versión 0.9.26 de Lazarus (2.4 de FreePascal), existe una propiedad de codificación en TXMLDocument, pero se ignora. La función writeXMLFile utiliza siempre UTF-8 y no genera un atributo de codificación en la primera línea del documento XML.

   Las versiones FPC de la rama actual no escriben de manera explícita un atributo de codificación UTF-8, y este es necesario para algunos programas que no pueden manejar XML sin ella.

Ver también

Enlaces externos


Tutoría de Aplicaciones Multihilo