Różnice między wybraną wersją a wersją aktualną.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
xerces_dom [2008/04/14 18:20] kmioduszewski |
xerces_dom [2008/04/14 22:10] kmioduszewski |
||
---|---|---|---|
Linia 1: | Linia 1: | ||
====== biblioteka dla XML: Xerces (DOM) ===== | ====== biblioteka dla XML: Xerces (DOM) ===== | ||
Xerces-C++ DOM jest częścią Xerces-C++ API zaprojektowanego do współpracy z plikami w formacie XML. API umożliwia parsowania, manipulowanie, walidowanie oraz generowanie poprawnych dokumentów. | Xerces-C++ DOM jest częścią Xerces-C++ API zaprojektowanego do współpracy z plikami w formacie XML. API umożliwia parsowania, manipulowanie, walidowanie oraz generowanie poprawnych dokumentów. | ||
+ | \\ | ||
Biblioteka DOM jest implementacją następujących rekomendacji W3C: | Biblioteka DOM jest implementacją następujących rekomendacji W3C: | ||
* [[http://www.w3.org/TR/1998/REC-DOM-Level-1-19981001/|Document Object Model (DOM) Level 1 Specification]] | * [[http://www.w3.org/TR/1998/REC-DOM-Level-1-19981001/|Document Object Model (DOM) Level 1 Specification]] | ||
Linia 10: | Linia 10: | ||
* [[http://www.w3.org/TR/2002/WD-DOM-Level-3-Core-20020409/|Document Object Model (DOM) Level 3 Core Specification]] | * [[http://www.w3.org/TR/2002/WD-DOM-Level-3-Core-20020409/|Document Object Model (DOM) Level 3 Core Specification]] | ||
* [[http://www.w3.org/TR/2002/WD-DOM-Level-3-ASLS-20020409/|Document Object Model (DOM) Level 3 Abstract Schemas and Load and Save Specification]] | * [[http://www.w3.org/TR/2002/WD-DOM-Level-3-ASLS-20020409/|Document Object Model (DOM) Level 3 Abstract Schemas and Load and Save Specification]] | ||
+ | \\ | ||
Więcej informacji na stronie projektu http://xerces.apache.org/xerces-c/. | Więcej informacji na stronie projektu http://xerces.apache.org/xerces-c/. | ||
Na stronie znajdują się źródła, oraz skompilowane wersje biblioteki na różne platformy. Kompletna instrukcja instalacji na różnych platformach znajduje się [[http://xerces.apache.org/xerces-c/install.html|tutaj]]. | Na stronie znajdują się źródła, oraz skompilowane wersje biblioteki na różne platformy. Kompletna instrukcja instalacji na różnych platformach znajduje się [[http://xerces.apache.org/xerces-c/install.html|tutaj]]. | ||
+ | |||
+ | |||
Linia 28: | Linia 30: | ||
#include <xercesc/util/XMLString.hpp> | #include <xercesc/util/XMLString.hpp> | ||
#include <xercesc/dom/DOM.hpp> | #include <xercesc/dom/DOM.hpp> | ||
- | #include<xercesc/parsers/XercesDOMParser.hpp> | + | #include <xercesc/parsers/XercesDOMParser.hpp> |
</code> | </code> | ||
Xerces posiada własny typ znakowy ''XMLCh'', który jest używany zamiast ''char'' i ''std::string''. Do konwersji pomiędzy typami ''char*'' a ''XMLCh*'' (w obie strony) używana jest funkcja ''XMLString::transcode()''. Pamięć zaalokowaną na łańcuchy należy zwalniać za pomocą funkcji ''XMLString::release()''. | Xerces posiada własny typ znakowy ''XMLCh'', który jest używany zamiast ''char'' i ''std::string''. Do konwersji pomiędzy typami ''char*'' a ''XMLCh*'' (w obie strony) używana jest funkcja ''XMLString::transcode()''. Pamięć zaalokowaną na łańcuchy należy zwalniać za pomocą funkcji ''XMLString::release()''. | ||
Linia 38: | Linia 40: | ||
#include <xercesc/util/XMLString.hpp> | #include <xercesc/util/XMLString.hpp> | ||
#include <xercesc/dom/DOM.hpp> | #include <xercesc/dom/DOM.hpp> | ||
- | #include<xercesc/parsers/XercesDOMParser.hpp> | + | #include <xercesc/parsers/XercesDOMParser.hpp> |
// ... | // ... | ||
#include <iostream> | #include <iostream> | ||
Linia 66: | Linia 68: | ||
</code> | </code> | ||
- | ===== przykład itd. ===== | + | |
- | cdn.. | + | |
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ===== XercesDOMParser ===== | ||
+ | Jest to parser umożliwiający wczytanie do pamięci struktury pliku XML za pomocą metody ''parse()''. Po czym uzyskujemy dostęp do obiektu ''DOMDocument'', po którym możemy poruszać się wykorzystując zaimplementowane w zgodzie z rekomendacjami W3C metody. | ||
+ | |||
+ | Poniżej przykładowe fragmenty kodu dotyczącego inicjalizacji i korzystania z ''XercesDOMParser''. | ||
+ | <code cpp> | ||
+ | xercesc::XercesDOMParser* parser = new xercesc::XercesDOMParser(); | ||
+ | parser->setValidationScheme(xercesc::XercesDOMParser::Val_Auto); //uruchamia walidację, jeżeli dostępne jest DTD (wewnętrzne/zewnętrzne) | ||
+ | parser->setDoNamespaces(true); | ||
+ | |||
+ | char* xmlFile = "file.xml"; | ||
+ | |||
+ | try { | ||
+ | parser->parse(xmlFile); | ||
+ | } | ||
+ | catch( const xercesc::XMLException& e ){ | ||
+ | //... | ||
+ | } | ||
+ | catch( const xercesc::DOMException& e ){ | ||
+ | //... | ||
+ | } | ||
+ | catch (...) { | ||
+ | //... | ||
+ | } | ||
+ | |||
+ | if(parser->getErrorCount()==0) { | ||
+ | xercesc::DOMDocument* XMLdoc = parser->getDocument(); | ||
+ | //... | ||
+ | } | ||
+ | |||
+ | </code> | ||
+ | |||
+ | Dobrym pomysłem jest zastosowanie własnego ''ErrorHandler'' do wykrywania błędów składniowych w trakcie parsowania i wyświetlania o nich informacji (typ, miejsce wystąpienia). Najprostszy sposób to zaimplementowanie metod z interfejsu ''HandlerBase'': | ||
+ | <code cpp> | ||
+ | #include <xercesc/sax/HandlerBase.hpp> | ||
+ | |||
+ | class myErrorHandler : xercesc::HandlerBase { | ||
+ | void warning( const xercesc::SAXParseException& e ) { | ||
+ | char *msg = xercesc::XMLString::transcode(e.getMessage()); | ||
+ | std::cout << "warning: " << msg | ||
+ | << " | line: " << e.getLineNumber() << std::endl; | ||
+ | xercesc::XMLString::release(&msg); | ||
+ | } | ||
+ | void error( const xercesc::SAXParseException& e ) { | ||
+ | // analogicznie jak wyżej | ||
+ | } | ||
+ | void fatalError( const xercesc::SAXParseException& e ) { | ||
+ | // j.w. | ||
+ | } | ||
+ | void resetErrors() {} | ||
+ | }; | ||
+ | |||
+ | //... | ||
+ | |||
+ | xercesc::XercesDOMParser* parser = new xercesc::XercesDOMParser(); | ||
+ | parser->setValidationScheme(xercesc::XercesDOMParser::Val_Auto); | ||
+ | parser->setDoNamespaces(true); | ||
+ | |||
+ | xercesc::ErrorHandler* errHandler = (xercesc::ErrorHandler*) new myErrorHandler(); | ||
+ | parser->setErrorHandler(errHandler); | ||
+ | |||
+ | </code> | ||
+ | |||
+ | |||
+ | |||
+ | ===== DOMDocument, operacje na dokumencie===== | ||
+ | Gdy dokument zostanie sparsowany bez żadnych błędów możemy swobodnie zacząć na nim pracować. |