XML Path Language (XPath)
Version 1.0

Deutsche, kommentierte ï¿½bersetzung

26. Februar 2002

Dies ist die deutsche ï¿½bersetzung der W3C-Empfehlung "XML Path Language (XPath)" vom 16. November 1999. Bitte beachten Sie, dass dieses Dokument ï¿½bersetzungsfehler enthalten kann. Die normative englische Version des Dokuments befindet sich unter http://www.w3.org/TR/1999/REC-xpath-19991116

Bitte schicken Sie Fehler in dieser ï¿½bersetzung oder Verbesserungsvorschlï¿½ge an den ï¿½bersetzer.

Diese Version:: http://www.obqo.de/w3c-trans/xpath-de-20020226
http://www.edition-w3c.de/TR/1999/REC-xpath-19991116
(verfï¿½gbar als XML oder HTML)
Aktuelle Version:: http://www.obqo.de/w3c-trans/xpath-de
http://www.edition-w3c.de/TR/xpath
Vorherige Version:: http://www.obqo.de/w3c-trans/xpath-de-20010910
ï¿½bersetzer:: Oliver Becker

Dieses Dokument ist urheberrechtlich geschï¿½tzt, Copyright ï¿½ 1999â€“2002 W3Cï¿½ (MIT, INRIA, Keio), alle Rechte vorbehalten. Die Rechte an dieser ï¿½bersetzung liegen beim ï¿½bersetzer, Copyright ï¿½ 2002 Oliver Becker.

ï¿½

XML Path Language (XPath)
Version 1.0

Empfehlung des W3C, 16. November 1999

Diese Version:: http://www.w3.org/TR/1999/REC-xpath-19991116
(verfï¿½gbar als XML oder HTML)
Aktuelle Version:: http://www.w3.org/TR/xpath
Vorherige Versionen:: http://www.w3.org/TR/1999/PR-xpath-19991008
http://www.w3.org/1999/08/WD-xpath-19990813
http://www.w3.org/1999/07/WD-xpath-19990709
http://www.w3.org/TR/1999/WD-xslt-19990421
Herausgeber:: James Clark
Steve DeRose (Inso Corp. and Brown University)

Zusammenfassung

Die Sprache XPath dient zur Adressierung von Teilen eines XML-Dokuments. Sie wurde fï¿½r die Verwendung sowohl in XSLT als auch in XPointer entworfen.

Status dieses Dokuments

Dieses Dokument wurde von Mitgliedern des W3C und anderen Interessierten geprï¿½ft und vom Direktor als W3C-Empfehlung gebilligt. Es ist ein abgeschlossenes Dokument und darf als Referenzmaterial verwendet oder als normative Referenz von einem anderen Dokument zitiert werden. Die Rolle des W3C bei der Erstellung dieser Empfehlung ist es, die Spezifikation bekannt zu machen und ihre breite Anwendung zu fï¿½rdern. Dies erhï¿½ht die Funktionsfï¿½higkeit und Interoperabilitï¿½t des Web.

Die Liste der bekannten Fehler in dieser Spezifikation ist unter http://www.w3.org/1999/11/REC-xpath-19991116-errata verfï¿½gbar.

Anmerkungen zu dieser Spezifikation kï¿½nnen an [email protected] geschickt werden; alle Anmerkungen sind in einem Archiv verfï¿½gbar.

Die englische Version dieser Spezifikation ist die einzig normative Version. Allerdings werden ï¿½bersetzungen dieses Dokuments unter http://www.w3.org/Style/XSL/translations.html aufgefï¿½hrt.

Aktuelle W3C-Empfehlungen und weitere technische Dokumente sind unter http://www.w3.org/TR zu finden.

Diese Spezifikation ist das Ergebnis der gemeinsamen Arbeit der XSL- und der XML-Linking-Arbeitsgruppen und damit Teil der W3C Style Activity und der W3C XML Activity.

Inhaltsverzeichnis

1 Einleitung
2 Lokalisierungspfade
ï¿½ï¿½ï¿½ï¿½2.1 Lokalisierungsschritte
ï¿½ï¿½ï¿½ï¿½2.2 Achsen
ï¿½ï¿½ï¿½ï¿½2.3 Knotentests
ï¿½ï¿½ï¿½ï¿½2.4 Prï¿½dikate
ï¿½ï¿½ï¿½ï¿½2.5 Abgekï¿½rzte Syntax
3 Ausdrï¿½cke
ï¿½ï¿½ï¿½ï¿½3.1 Grundlagen
ï¿½ï¿½ï¿½ï¿½3.2 Funktionsaufrufe
ï¿½ï¿½ï¿½ï¿½3.3 Knotenmengen
ï¿½ï¿½ï¿½ï¿½3.4 Boolesche Werte
ï¿½ï¿½ï¿½ï¿½3.5 Zahlen
ï¿½ï¿½ï¿½ï¿½3.6 Zeichenketten
ï¿½ï¿½ï¿½ï¿½3.7 Lexikalische Struktur
4 Bibliothek der Grundfunktionen
ï¿½ï¿½ï¿½ï¿½4.1 Funktionen auf Knotenmengen
ï¿½ï¿½ï¿½ï¿½4.2 Zeichenkettenfunktionen
ï¿½ï¿½ï¿½ï¿½4.3 Boolesche Funktionen
ï¿½ï¿½ï¿½ï¿½4.4 Zahlenfunktionen
5 Datenmodell
ï¿½ï¿½ï¿½ï¿½5.1 Wurzelknoten
ï¿½ï¿½ï¿½ï¿½5.2 Elementknoten
ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½5.2.1 Eindeutige IDs
ï¿½ï¿½ï¿½ï¿½5.3 Attributknoten
ï¿½ï¿½ï¿½ï¿½5.4 Namensraumknoten
ï¿½ï¿½ï¿½ï¿½5.5 Processing-Instruction-Knoten
ï¿½ï¿½ï¿½ï¿½5.6 Kommentarknoten
ï¿½ï¿½ï¿½ï¿½5.7 Textknoten
6 Konformitï¿½t

Anhang

A Referenzen
ï¿½ï¿½ï¿½ï¿½A.1 Normative Referenzen
ï¿½ï¿½ï¿½ï¿½A.2 Andere Referenzen
B Abbildung auf die XML-Informationsmenge (nicht normativ)

1 Einleitung

XPath ist das Ergebnis der Bemï¿½hungen, eine gemeinsame Syntax und Semantik fï¿½r jene Funktionen bereitzustellen, die sowohl von XSL Transformations [XSLT] als auch von XPointer [XPointer] genutzt werden. Die primï¿½re Aufgabe von XPath besteht in der Adressierung von Teilen eines XML-Dokuments [XML]. Zur Unterstï¿½tzung dieser Aufgabe werden auï¿½erdem einfache Hilfsmittel fï¿½r die Manipulation von Zeichenketten, Zahlen und booleschen Werten bereitgestellt. XPath benutzt eine kompakte Nicht-XML-Syntax, um die Verwendung von XPath-Ausdrï¿½cken innerhalb von URIs und XML-Attributen zu erleichtern. XPath operiert auf der abstrakten, logischen Struktur eines XML-Dokuments, nicht auf seiner ï¿½uï¿½erlichen Syntax. Seinen Namen erhï¿½lt XPath durch die Verwendung einer auch in URLs genutzten Pfad-Notation (path), mit der sich durch die hierarchische Struktur eines XML-Dokuments navigieren lï¿½sst.

Neben der Verwendung fï¿½r die Adressierung wurde XPath so gestaltet, dass eine natï¿½rliche Teilmenge davon zum Matching (Testen, ob ein Knoten auf ein Muster passt) genutzt werden kann. Diese Anwendung von XPath ist in XSLT beschrieben.

Anmerkung des ï¿½bersetzers:

Diese Teilmenge wird in XSLT Muster (pattern) genannt. Obwohl diese Muster durch eine eigene Grammatik definiert werden, ist jedes Muster auch ein XPath-Ausdruck.

Neben XSLT und XPointer existieren weitere Spezifikationen, die XPath nutzen. Als Beispiel sei hier der Arbeitsentwurf des W3C fï¿½r die XML-Abfragesprache XQuery [XQuery] genannt, deren Syntax erweiterte XPath-Ausdrï¿½cke verwendet.

XPath modelliert ein XML-Dokument als einen Baum, der aus Knoten besteht. Es gibt verschiedene Knotentypen, unter anderem Elementknoten, Attributknoten und Textknoten. XPath definiert, wie der Zeichenkettenwert fï¿½r jeden Knotentyp berechnet wird. Einige Knoten besitzen zusï¿½tzlich einen Namen. XPath unterstï¿½tzt in vollem Umfang XML-Namensrï¿½ume [XML Names]. Daher wird der Name eines Knotens als ein Paar aus einem lokalen Bestandteil und einem gegebenenfalls leeren Namensraum-URI modelliert â€“ dieses wird erweiterter Name genannt. Das Datenmodell ist detailliert in [5 Datenmodell] beschrieben.

Anmerkung des ï¿½bersetzers:

Zur Veranschaulichung der durch XPath modellierten Baumstruktur soll folgendes Beispiel dienen:





   200g Mehl
   
   
      Zuerst nehmen Sie das
      Mehl
      und mischen es mit ...

Dieses recht kurze XML-Dokument besitzt bereits eine aus 23 Knoten bestehende Baumreprï¿½sentation:

Die XML-Deklaration sowie die Dokumenttyp-Deklaration finden sich in der Baumdarstellung nicht wieder, auf sie kann ï¿½ber einen XPath-Ausdruck auch nicht zugegriffen werden. Alle anderen Bestandteile des Dokuments (Wurzel, Elemente, Textinhalt, Attribute, Namensrï¿½ume, Kommentare, Processing Instructions) werden durch entsprechende Knoten des Baumes reprï¿½sentiert. Die leeren Quadrate symbolisieren Textknoten, die ausschlieï¿½lich Leerraumzeichen enthalten. Inwieweit sich solcher Leerraum in eigenen Textknoten wiederfindet, wird von der XPath nutzenden Anwendung bestimmt. Schlieï¿½lich sei auf die implizit zu jedem Element gehï¿½renden Namensraumknoten fï¿½r den xml-Namensraum hingewiesen.

Das Document Object Model [DOM] definiert ebenfalls eine Baumreprï¿½sentation, die allerdings in einigen Punkten von der in XPath verwendeten abweicht. Auf diese Unterschiede wird innerhalb des Kapitels [5 Datenmodell] eingegangen.

Das primï¿½re syntaktische Konstrukt in XPath ist der Ausdruck. Ein Ausdruck lï¿½sst sich aus der Produktion Expr ableiten. Die Auswertung eines Ausdrucks ergibt ein Objekt, das zu einem der folgenden vier Grundtypen gehï¿½rt:

node-set (eine ungeordnete Menge von Knoten ohne Duplikate)
boolean (wahr oder falsch)
number (eine Gleitkommazahl)
string (eine Zeichenkette bestehend aus UCS-Zeichen)

Anmerkung des ï¿½bersetzers:

Das sind die vier Grundtypen, die XPath definiert. Tatsï¿½chlich kï¿½nnen darauf aufbauende Spezifikationen weitere Typen definieren, sodass die Auswertung eines XPath-Ausdrucks ein Objekt dieses neuen Typs ergeben kann. Insbesondere kï¿½nnen im Ausdruck enthaltene Variablen Objekte anderer Typen aufnehmen.

Wie man sieht, gibt es keinen Datentyp fï¿½r Knoten. Ein einzelner Knoten kann aber als Knotenmenge (node-set) dargestellt werden, die genau ein Element enthï¿½lt.

Die innerhalb von Zeichenketten erlaubten UCS-Zeichen (Universal Multiple-Octet Coded Character Set) sind in [ISO/IEC 10646] bzw. [ISO/IEC 10646, 2nd Edition] beschrieben.

Ein Ausdruck wird immer bezï¿½glich eines Kontextes ausgewertet. XSLT und XPointer spezifizieren, wie dieser Kontext bei der Verwendung von XPath-Ausdrï¿½cken in XSLT bzw. XPointer bestimmt wird. Der Kontext besteht aus:

einem Knoten (dem Kontextknoten)
einem Paar von positiven ganzen Zahlen ungleich 0 (der Kontextposition und der Kontextgrï¿½ï¿½e)
einer Menge von Variablenbelegungen
einer Funktionsbibliothek
den Namensraumdeklarationen, in deren Gï¿½ltigkeitsbereich der Ausdruck liegt

Die Kontextposition ist immer kleiner oder gleich der Kontextgrï¿½ï¿½e.

Die Variablenbelegungen bestehen aus einer Abbildung von Variablennamen auf Variablenwerte. Der Wert einer Variablen ist ein Objekt, welches von jedem beliebigen Typ sein kann, der fï¿½r Ausdrï¿½cke mï¿½glich ist. Daneben sind auch weitere Typen mï¿½glich, die hier nicht spezifiziert werden.

Anmerkung des ï¿½bersetzers:

In der XSLT-1.0-Spezifikation [XSLT] wird beispielsweise als neuer Typ Ergebnisteilbaum (result tree fragment) eingefï¿½hrt. Werte dieses Typs entstehen im Ergebnis des Transformationsprozesses. Durch die folgende Variablenvereinbarung wird z.B. eine Variable namens antwort erzeugt, deren Wert ein Ergebnisteilbaum ist:

Dieser Typ wird voraussichtlich in zukï¿½nftigen XSLT-Versionen nicht mehr existieren, da das Ergebnis einer Transformation dann eine normale Knotenmenge vom Typ node-set sein wird, siehe [XSLT 2.0].

Die folgende Anweisung erzeugt dagegen eine Variable, deren Wert sich aus der Berechnung eines XPath-Ausdrucks expression ergibt:

An dieser Stelle sei darauf hingewiesen, dass die Erzeugung der Variablenbelegungen fï¿½r antwort und var ein XSLT-Sprachmittel ist. XPath selbst stellt hierfï¿½r keinerlei Konstrukte bereit. Neben xsl:variable besitzt XSLT fï¿½r diesen Zweck xsl:param.

Die XPointer-Spezifikation [XPointer], die ebenfalls XPath nutzt, sieht keine Mï¿½glichkeiten fï¿½r das Erzeugen von Variablenbelegungen vor. Die Verwendung von Variablenreferenzen innerhalb eines XPointer-Ausdrucks fï¿½hrt daher zu einem syntaktischen Fehler. Die als Arbeitsentwurf des W3C vorgelegte Abfragesprache fï¿½r XML-Dokumente XQuery [XQuery] benutzt zur Erzeugung von Variablenbelegungen so genannte FLWR-Ausdrï¿½cke (gesprochen "flower", eine Abkï¿½rzung fï¿½r FOR-, LET-, WHERE- und RETURN-Klauseln).

Andere auf XPath aufbauende Spezifikationen mï¿½ssen in analoger Weise definieren, wie Variablenbelegungen fï¿½r einen Kontext erzeugt werden.

Die Funktionsbibliothek besteht aus einer Abbildung von Funktionsnamen auf Funktionen. Jede Funktion besitzt null oder mehr Argumente und liefert einen einzelnen Wert. Diese Spezifikation definiert eine Bibliothek von Grundfunktionen, die von allen XPath-Implementationen unterstï¿½tzt werden muss (siehe [4 Bibliothek der Grundfunktionen]). Bei einer Grundfunktion gehï¿½ren die Argumente und das Ergebnis einem der vier Grundtypen an. Sowohl XSLT als auch XPointer erweitern XPath um zusï¿½tzliche Funktionen, von denen einige auf den vier Grundtypen, andere auf zusï¿½tzlichen, durch XSLT und XPointer definierten Typen operieren.

Namensraumdeklarationen bestehen aus einer Abbildung von Prï¿½fixen auf Namensraum-URIs.

Anmerkung des ï¿½bersetzers:

Angenommen, ein Element enthï¿½lt in seinem Start-Tag folgende Namensraumdeklaration: xmlns:xlink="http://www.w3.org/1999/xlink". Ein Kontext, fï¿½r den diese Deklaration gï¿½ltig ist, enthï¿½lt dann eine Abbildung des Prï¿½fixes xlink auf den URI http://www.w3.org/1999/xlink.

Die Variablenbelegungen, die Funktionsbibliothek und die Namensraumdeklarationen, die benutzt werden, um einen Teilausdruck zu berechnen, sind immer dieselben, die auch fï¿½r den umgebenden Ausdruck benutzt werden. Der Kontextknoten, die Kontextposition und die Kontextgrï¿½ï¿½e, die zur Berechnung eines Teilausdrucks benutzt werden, sind dagegen zuweilen verschieden von denen des umgebenden Ausdrucks. Mehrere Arten von Ausdrï¿½cken ï¿½ndern den Kontextknoten, aber nur Prï¿½dikate ï¿½ndern die Kontextposition und die Kontextgrï¿½ï¿½e (siehe [2.4 Prï¿½dikate]). Bei der Beschreibung, wie bestimmte Ausdrï¿½cke zu berechnen sind, wird immer explizit angegeben, ob sich der Kontextknoten, die Kontextposition oder die Kontextgrï¿½ï¿½e bei der Berechnung von Teilausdrï¿½cken ï¿½ndert. Wird nichts ï¿½ber Kontextknoten, Kontextposition und Kontextgrï¿½ï¿½e ausgesagt, bleiben sie bei der Berechnung von Teilausdrï¿½cken dieser Ausdrï¿½cke gleich.

Anmerkung des ï¿½bersetzers:

Zur Erklï¿½rung hier ein kleiner Vorgriff:

Innerhalb eines Lokalisierungspfades ï¿½ndert jeder Schritt den Kontextknoten, der fï¿½r die Berechnung der folgenden Schritte relevant ist. Durch ein Prï¿½dikat werden Knoten aus einer Knotenmenge herausgefiltert, sodass die Kontextgrï¿½ï¿½e sich in der Regel verkleinert und die Position der gefilterten Knoten sich entsprechend ï¿½ndert.

XPath-Ausdrï¿½cke erscheinen hï¿½ufig in XML-Attributen. Die in diesem Abschnitt spezifizierte Grammatik wird auf Attributwerte nach ihrer Normalisierung gemï¿½ï¿½ XML 1.0 angewendet. Wenn beispielsweise die Grammatik das Zeichen < verwendet, darf dieses nicht in der XML-Quelle als < auftreten, sondern muss gemï¿½ï¿½ den XML-1.0-Regeln notiert werden, zum Beispiel durch Eingabe als <. Innerhalb von Ausdrï¿½cken werden Zeichenkettenliterale durch einfache oder doppelte Anfï¿½hrungszeichen begrenzt, die ebenfalls zur Begrenzung von XML-Attributen verwendet werden. Um zu vermeiden, dass ein Anfï¿½hrungszeichen innerhalb eines Ausdrucks durch den XML-Prozessor als Abschluss des Attributwertes interpretiert wird, kann das Anfï¿½hrungszeichen als Zeichenreferenz eingegeben werden (" oder '). Alternativ kï¿½nnen im Ausdruck einfache Anfï¿½hrungszeichen benutzt werden, falls das XML-Attribut durch doppelte Anfï¿½hrungszeichen begrenzt wird oder umgekehrt.

Anmerkung des ï¿½bersetzers:

Statt "Zeichenreferenz" muss es hier "Entity-Referenz" heiï¿½en.

Abgesehen davon gibt es immer noch Fï¿½lle, in denen dieses einfache Kochrezept nicht ausreichend ist â€“ nï¿½mlich dann, wenn eine Zeichenkette benï¿½tigt wird, die beide Arten von Anfï¿½hrungszeichen enthalten soll.

Angenommen, es soll getestet werden, ob der Inhalt des Elements para mit der Zeichenkette ï¿½Sie fragte: "Wie geht's?"ï¿½ ï¿½bereinstimmt. Mï¿½chte man diese Zeichenkette innerhalb eines XPath-Ausdrucks durch doppelte Anfï¿½hrungszeichen begrenzen, kï¿½nnte man auf die Idee kommen, beispielsweise durch Verwendung der Entity-Referenz " Folgendes zu schreiben:

para="Sie fragte: "Wie geht's?""

Das ist aber keine Lï¿½sung, da ein XML-Parser, der diese Zeichenfolge analysiert, Entity-Referenzen auflï¿½st. Ein darauf aufsetzender XPath-Prozessor kann nicht mehr zwischen ï¿½"ï¿½ und ï¿½"ï¿½ unterscheiden. Formuliert man im nï¿½chsten Schritt dann nï¿½mlich weiter

(diese Zeile ist im XML-Sinn wohlgeformt), so fï¿½hrt das zu einem Fehler im XPath-Prozessor, da dieser trotzdem die folgende Zeichenkette auswertet:

para="Sie fragte: "Wie geht's?""

Eine einfache Lï¿½sung fï¿½r solche Fï¿½lle besteht darin, die betreffende Zeichenkette als Wert einer Variablen zu definieren, etwa in XSLT per

Sie fragte: "Wie geht's?"

und anschlieï¿½end diese Variable in XPath-Ausdrï¿½cken zu verwenden.

Alternativ kann man die gewï¿½nschte Zeichenkette aus mehreren Teilen zusammensetzen (unter Benutzung der noch zu erlï¿½uternden Funktion concat), wobei jede Teilzeichenkette jeweils nur eine Sorte von Anfï¿½hrungszeichen enthï¿½lt:

para=concat('Sie fragte: "Wie geht', "'", 's?"')

Das Anfï¿½hrungszeichen, das zur Begrenzung dieses Ausdrucks innerhalb eines Attributwertes genutzt wird, muss dann durch die dazugehï¿½rige Entity-Referenz ersetzt werden. Das Ergebnis sieht zwar unï¿½bersichtlich aus, ist aber syntaktisch korrekt:

Diese zweite Variante muss verwendet werden, wenn Variablen nicht erlaubt sind, etwa innerhalb eines XSLT-Musters oder als Bestandteil eines XPointers.

Ein wichtiger spezieller Ausdruck ist der Lokalisierungspfad. Ein Lokalisierungspfad wï¿½hlt eine Knotenmenge relativ zu einem Kontextknoten aus. Das Ergebnis der Berechnung eines Ausdrucks, der ein Lokalisierungspfad ist, ist genau die Knotenmenge, die die durch den Lokalisierungspfad ausgewï¿½hlten Knoten enthï¿½lt. Lokalisierungspfade kï¿½nnen Ausdrï¿½cke rekursiv enthalten, die zum Filtern von Knotenmengen benutzt werden. Ein Lokalisierungspfad lï¿½sst sich aus der Produktion LocationPath ableiten.

Die in der nachfolgenden Grammatik verwendeten Nichtterminale QName und NCName sind in [XML Names] definiert, S ist in [XML] definiert. Die Grammatik verwendet die gleiche EBNF-Notation wie in [XML] (mit der Ausnahme, dass Grammatiksymbole immer mit einem Groï¿½buchstaben beginnen).

Anmerkung des ï¿½bersetzers:

Die Erweiterte Backus-Naur-Form (EBNF) wird zur Notation von formalen Grammatiken verwendet. Sie wird im Kapitel Notation der XML-Spezifikation [XML, 2nd Edition] nï¿½her erlï¿½utert.

Ausdrï¿½cke werden geparst, indem die Zeichenfolge in einzelne Tokens zerlegt und anschlieï¿½end die entstehende Folge der Tokens geparst wird. Leerraumzeichen kï¿½nnen beliebig zwischen Tokens verwendet werden. Der Zerlegungsprozess wird in [3.7 Lexikalische Struktur] beschrieben.

Anmerkung des ï¿½bersetzers:

Ein Token ist eine syntaktische Einheit von Zeichen, etwa der Name ï¿½htmlï¿½, die Zahl ï¿½3.14159ï¿½ oder der Operator ï¿½!=ï¿½. Die zwischen diesen Tokens erlaubten Leerraumzeichen sind gemï¿½ï¿½ der XML-Spezifikation Folgen aus Leerzeichen (#x20), Tabulatoren (#x9), Zeilenvorschï¿½ben (#xA) und Wagenrï¿½cklï¿½ufen (#xD). Innerhalb eines Tokens dï¿½rfen keine solchen Leerraumzeichen auftreten, so z.B. nicht zwischen den beiden einzelnen Zeichen ï¿½!ï¿½ und ï¿½=ï¿½ des Operators ï¿½!=ï¿½.

2 Lokalisierungspfade

Obwohl Lokalisierungspfade nicht das allgemeinste grammatische Konstrukt der Sprache darstellen (ein Lokalisierungspfad ist ein Spezialfall eines Ausdrucks), sind sie doch das wichtigste Konstrukt und werden deshalb als Erstes beschrieben.

Jeder Lokalisierungspfad kann durch eine unkomplizierte und eher verbale Syntax ausgedrï¿½ckt werden. Daneben gibt es eine Reihe von syntaktischen Abkï¿½rzungen, mit denen sich hï¿½ufige Fï¿½lle kurz und prï¿½gnant ausdrï¿½cken lassen. Dieser Abschnitt erlï¿½utert die Semantik von Lokalisierungspfaden anhand der ausfï¿½hrlichen Syntax. Die abgekï¿½rzte Syntax wird im Anschluss daran erlï¿½utert, indem gezeigt wird, wie diese auf die ausfï¿½hrliche Syntax abgebildet wird (siehe [2.5 Abgekï¿½rzte Syntax]).

Es folgen einige Beispiele fï¿½r Lokalisierungspfade unter Benutzung der ausfï¿½hrlichen Syntax:

child::para wï¿½hlt die Kindelemente para des Kontextknotens aus.
child::* wï¿½hlt alle Kindelemente des Kontextknotens aus.
child::text() wï¿½hlt alle Textknoten aus, die Kinder des Kontextknotens sind.

child::node() wï¿½hlt alle Kindknoten des Kontextknotens aus, unabhï¿½ngig von ihrem Knotentyp.

Anmerkung des ï¿½bersetzers:

Obwohl sich sï¿½mtliche XPath-Lokalisierungspfade fï¿½r Kontextknoten jedes Typs anwenden lassen, muss an dieser Stelle darauf hingewiesen werden, dass nur der Wurzelknoten sowie Elementknoten Kinder haben kï¿½nnen. Diese Kinder kï¿½nnen Element-, Text-, Kommentar- und Processing-Instruction-Knoten sein. Attribut- und Namensraumknoten sind niemals Kinder anderer Knoten. Dieses Konzept wird noch einmal ausfï¿½hrlich in Kapitel [5 Datenmodell] beschrieben.

attribute::name wï¿½hlt das Attribut name des Kontextknotens aus.

attribute::* wï¿½hlt alle Attribute des Kontextknotens aus.

Anmerkung des ï¿½bersetzers:

Diese beiden Ausdrï¿½cke sind nur sinnvoll, wenn der Kontextknoten ein Elementknoten ist. Fï¿½r alle anderen Knotentypen liefern sie die leere Knotenmenge.

descendant::para wï¿½hlt die para-Elemente aus, die Nachkommen des Kontextknotens sind.
ancestor::div wï¿½hlt alle div-Elemente aus, die Vorfahren des Kontextknotens sind.
ancestor-or-self::div wï¿½hlt alle div-Vorfahren des Kontextknotens sowie auch den Kontextknoten selbst aus, falls dieser ein div-Element ist.
descendant-or-self::para wï¿½hlt alle para-Nachkommen des Kontextknotens aus, sowie auch den Kontextknoten selbst, falls dieser ein para-Element ist.
self::para wï¿½hlt den Kontextknoten aus, falls dieser ein para-Element ist, und sonst nichts.
child::chapter/descendant::para wï¿½hlt die para-Elemente aus, die Nachkommen der chapter-Kindelemente des Kontextknotens sind.
child::*/child::para wï¿½hlt alle para-Enkelelemente des Kontextknotens aus.

/ wï¿½hlt die Wurzel des Dokuments aus (diese ist immer der Vater des Dokumentelements).

Anmerkung des ï¿½bersetzers:

Der Begriff Wurzel unterscheidet sich hier von dem in der XML-Spezifikation [XML, 2nd Edition] genutzten. Dort bezeichnen Wurzel und Dokumentelement das Gleiche. In der XPath-Terminologie ist das Dokumentelement ein Kind des Wurzelknotens. Der Wurzelknoten entspricht damit dem Dokument-Entity, siehe [5.1 Wurzelknoten]. Das ist insofern wichtig, als der Wurzelknoten zusï¿½tzlich Kommentar- oder Processing-Instruction-Knoten als Kinder haben kann, die damit Geschwister des Dokumentelements sind.

Des Weiteren muss hier hinzugefï¿½gt werden, dass durch / die Wurzel des Dokuments ausgewï¿½hlt wird, in dem sich der Kontextknoten befindet. Es lï¿½sst sich leicht eine Knotenmenge bilden, die Knoten aus verschiedenen Dokumenten enthï¿½lt. Die in XSLT definierte Funktion document liefert beispielsweise den Wurzelknoten eines anderen Dokuments.

/descendant::para wï¿½hlt alle para-Elemente aus, die im gleichen Dokument wie der Kontextknoten enthalten sind.

Anmerkung des ï¿½bersetzers:

Genau genommen werden alle para-Elemente ausgewï¿½hlt, die Nachkommen der Wurzel des Dokuments sind, zu dem der Kontextknoten gehï¿½rt.

/descendant::olist/child::item wï¿½hlt alle item-Elemente aus, die ein olist-Vaterelement besitzen und die sich im gleichen Dokument wie der Kontextknoten befinden.

Anmerkung des ï¿½bersetzers:

Die folgenden Beispiele zeigen Lokalisierungspfade, bei denen die ursprï¿½nglich ausgewï¿½hlten Knotenmengen durch nachgestellte Filterausdrï¿½cke in eckigen Klammern, so genannte Prï¿½dikate, weiter eingeschrï¿½nkt werden.

child::para[position()=1] wï¿½hlt das erste para-Kindelement des Kontextknotens aus.
child::para[position()=last()] wï¿½hlt das letzte para-Kindelement des Kontextknotens aus.
child::para[position()=last()-1] wï¿½hlt das vorletzte para-Kindelement des Kontextknotens aus.
child::para[position()>1] wï¿½hlt alle para-Kindelemente des Kontextknotens aus, mit Ausnahme des ersten para-Kindelements des Kontextknotens.
following-sibling::chapter[position()=1] wï¿½hlt das nï¿½chste chapter-Geschwisterelement des Kontextknotens aus.

preceding-sibling::chapter[position()=1] wï¿½hlt das vorhergehende chapter-Geschwisterelement des Kontextknotens aus.

Anmerkung des ï¿½bersetzers:

An dieser Stelle sei als kurzer Vorgriff darauf hingewiesen, dass sich die Position eines Knotens in der aktuellen Kontextknotenliste ï¿½ber die Funktion position bestimmen lï¿½sst und diese Position offenbar von der Blickrichtung abhï¿½ngt. Von allen vorhergehenden Geschwisterelementen befindet sich der unmittelbare Vorgï¿½nger an der Position 1.

/descendant::figure[position()=42] wï¿½hlt das zweiundvierzigste figure-Element im Dokument aus.

Anmerkung des ï¿½bersetzers:

Hier werden alle figure-Nachkommen des Wurzelknotens betrachtet. Ausgehend von ihrer natï¿½rlichen Reihenfolge im Dokument wird aus der gesamten Menge das zweiundvierzigste ausgewï¿½hlt. Die Definition dieser natï¿½rlichen Reihenfolge, der so genannten Dokumentordnung, ist Bestandteil des Kapitels [5 Datenmodell].

/child::doc/child::chapter[position()=5]/child::section[position()=2] wï¿½hlt das zweite section-Element des fï¿½nften chapter-Elements des doc-Dokumentelements aus.
child::para[attribute::type="warning"] wï¿½hlt alle para-Kindelemente des Kontextknotens aus, die ein type-Attribut mit dem Wert warning besitzen.
child::para[attribute::type='warning'][position()=5] wï¿½hlt das fï¿½nfte para-Kindelement des Kontextknotens aus, das ein Attribut type mit dem Wert warning besitzt.

child::para[position()=5][attribute::type="warning"] wï¿½hlt das fï¿½nfte para-Kindelement des Kontextknotens aus, wenn dieses Kind ein type-Attribut mit dem Wert warning besitzt.

Anmerkung des ï¿½bersetzers:

Die letzten beiden Beispiele zeigen, wie sich durch ein Prï¿½dikat Kontextgrï¿½ï¿½e und -position ï¿½ndern kï¿½nnen. Das Prï¿½dikat [position()=5] liefert immer eine Knotenmenge, die maximal einen Knoten enthï¿½lt, je nachdem, ob es einen fï¿½nften Knoten gibt oder nicht. Das erste der beiden Beispiele beschrï¿½nkt zunï¿½chst die betrachtete Knotenmenge auf die para-Elemente mit dem Attribut type="warning" und wï¿½hlt anschlieï¿½end aus diesen das fï¿½nfte aus. Das zweite Beispiel wï¿½hlt zuerst das fï¿½nfte para-Element und anschlieï¿½end aus der verbleibenden Knotenmenge die Knoten mit dem gewï¿½nschten Attribut aus. Besitzt das fï¿½nfte para-Element also gerade kein Attribut type="warning", so ist das Ergebnis in diesem Fall die leere Knotenmenge.

child::chapter[child::title='Introduction'] wï¿½hlt die chapter-Kindelemente des Kontextknotens aus, die wenigstens ein title-Kindelement mit einem Zeichenkettenwert gleich Introduction besitzen.
child::chapter[child::title] wï¿½hlt die chapter-Kindelemente des Kontextknotens aus, die ein oder mehrere title-Kindelemente besitzen.

child::*[self::chapter or self::appendix] wï¿½hlt die chapter- und appendix-Kindelemente des Kontextknotens aus.

Anmerkung des ï¿½bersetzers:

Hier werden aus allen Kindern (child::*) diejenigen ausgewï¿½hlt, die selbst (self::) entweder ein chapter- oder ein appendix-Element sind. Hier muss man etwas aufpassen, da der Ausdruck in den eckigen Klammern fï¿½r einen anderen Kontextknoten ausgewertet wird als der Ausdruck vor den Klammern. Der Vergleich mit den beiden vorhergehenden Beispielen verdeutlicht den Unterschied. Die genaue Definition folgt in Kapitel [2.4 Prï¿½dikate].

child::*[self::chapter or self::appendix][position()=last()] wï¿½hlt das letzte chapter- oder appendix-Kindelement des Kontextknotens aus.

Anmerkung des ï¿½bersetzers:

Hier wird zunï¿½chst die Menge aller chapter- oder appendix-Kinder betrachtet und aus dieser dann das letzte ausgewï¿½hlt. Die Ergebnisknotenmenge enthï¿½lt damit (maximal) einen Knoten.

Es gibt zwei Arten von Lokalisierungspfaden: relative und absolute Lokalisierungspfade.

Ein relativer Lokalisierungspfad wird durch eine Folge aus einem oder mehreren Lokalisierungsschritten gebildet, die durch / voneinander getrennt sind. Die Schritte eines relativen Lokalisierungspfades werden von links nach rechts zusammengesetzt. Jeder Schritt wï¿½hlt der Reihe nach eine Knotenmenge relativ zu einem Kontextknoten aus. Eine Anfangsfolge von Schritten wird mit einem folgenden Schritt wie folgt zusammengesetzt: Die Anfangsfolge von Schritten wï¿½hlt eine Knotenmenge relativ zu einem Kontextknoten aus. Jeder Knoten in dieser Menge wird dann als Kontextknoten fï¿½r den folgenden Schritt benutzt. Die durch diesen Schritt bestimmten Knotenmengen werden vereinigt. Die Vereinigung ist dann genau die Knotenmenge, die durch das Zusammensetzen der Schritte ausgewï¿½hlt wird. Zum Beispiel wï¿½hlt child::div/child::para die para-Kindelemente der div-Kindelemente des Kontextknotens aus, oder â€“ mit anderen Worten â€“ die para-Enkelelemente, die div-Elternelemente haben.

Ein absoluter Lokalisierungspfad besteht aus dem Zeichen / und einem optional folgenden relativen Lokalisierungspfad. Ein / allein wï¿½hlt den Wurzelknoten des Dokuments aus, das den Kontextknoten enthï¿½lt. Falls ein relativer Lokalisierungspfad folgt, so wï¿½hlt der Lokalisierungspfad die Knotenmenge aus, die ein relativer Lokalisierungspfad relativ zum Wurzelknoten des den Kontextknoten enthaltenen Dokuments auswï¿½hlen wï¿½rde.

Anmerkung des ï¿½bersetzers:

Hier bietet sich der Vergleich zu Pfaden im Dateisystem an: Sowohl in UNIX-Betriebssystemen als auch innerhalb von URLs wird der Schrï¿½gstrich ï¿½/ï¿½ als Trennzeichen innerhalb von Dateipfaden benutzt. In ï¿½hnlicher Weise kann man sich Pfade in einem XML-Baum vorstellen. Ein relativer Pfad geht immer vom aktuellen Knoten (dem Kontextknoten) aus, ein absoluter Pfad beginnt immer an der Dokumentwurzel. Genau genommen ist ein absoluter Pfad allerdings ebenfalls relativ, nï¿½mlich zum Dokument des Kontextknotens. Das spielt eine Rolle, wenn Knoten aus mehreren Dokumenten verarbeitet werden.

Man sollte sich allerdings einer Feinheit bewusst sein: Wï¿½hrend beispielsweise durch ï¿½verzeichnis1/verzeichnis2/datei3ï¿½ in einem Dateisystem exakt eine Datei adressiert wird, eben jene, die den Namen ï¿½datei3ï¿½ trï¿½gt und sich in dem Unterverzeichnis ï¿½verzeichnis1/verzeichnis2ï¿½ befindet, wï¿½hlt ein analoger XPath immer eine Knotenmenge aus, die in der Regel mehrere Knoten enthalten kann. Das sollte aber nicht weiter verwundern, darf ein Element doch durchaus mehrere gleichnamige Kindelemente besitzen.

Lokalisierungspfade

[1]ï¿½ï¿½ï¿½	LocationPath	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	RelativeLocationPath
			\| AbsoluteLocationPath
[2]ï¿½ï¿½ï¿½	AbsoluteLocationPath	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	'/' RelativeLocationPath?
			\| AbbreviatedAbsoluteLocationPath
[3]ï¿½ï¿½ï¿½	RelativeLocationPath	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	Step
			\| RelativeLocationPath '/' Step
			\| AbbreviatedRelativeLocationPath

Anmerkung des ï¿½bersetzers:

Die obige Grammatik gibt das bisher Beschriebene noch einmal formal wieder. Wie man sieht, kï¿½nnen Lokalisierungspfade auch abgekï¿½rzte Bestandteile enthalten. Diese werden in Kapitel [2.5 Abgekï¿½rzte Syntax] beschrieben.

2.1 Lokalisierungsschritte

Ein Lokalisierungsschritt hat drei Bestandteile:

eine Achse, welche die Beziehung zwischen den durch den Lokalisierungsschritt ausgewï¿½hlten Knoten und dem Kontextknoten innerhalb des Baumes spezifiziert,
einen Knotentest, der den Knotentyp und den erweiterten Namen der durch den Lokalisierungsschritt ausgewï¿½hlten Knoten spezifiziert, sowie

null oder mehr Prï¿½dikate, die mittels beliebiger Ausdrï¿½cke die durch den Lokalisierungsschritt ausgewï¿½hlte Knotenmenge weiter verfeinern kï¿½nnen.

Anmerkung des ï¿½bersetzers:

Prï¿½dikate im mathematischen Sinn sind Aussagen ï¿½ber Eigenschaften, die fï¿½r die betreffenden Objekte wahr oder falsch sein kï¿½nnen. In diesem Sinn wï¿½hlt ein Prï¿½dikat aus einer Knotenmenge genau diejenigen Knoten aus, fï¿½r die die entsprechende Aussage zutrifft. Aber auch ohne Kenntnis der Begriffswelt der Prï¿½dikatenlogik kann man sich anhand der Begriffe ï¿½Prï¿½dikatsweinï¿½ oder ï¿½Prï¿½dikatsexamenï¿½ verdeutlichen, dass hier jeweils eine bestimmte Eigenschaft bzw. Qualitï¿½t des beschriebenen Objekts ausgedrï¿½ckt wird.

Ein Lokalisierungsschritt besteht syntaktisch aus dem Namen der Achse, gefolgt von zwei Doppelpunkten und dem Knotentest, gefolgt von null oder mehr in eckigen Klammern eingeschlossenen Ausdrï¿½cken. Zum Beispiel enthï¿½lt child::para[position()=1] die Achse child, den Knotentest para und ein Prï¿½dikat [position()=1].

Die durch den Lokalisierungspfad ausgewï¿½hlte Knotenmenge ergibt sich aus der durch Achse und Knotentest bestimmten Ausgangsknotenmenge, indem dort der Reihe nach die einzelnen Prï¿½dikate angewendet werden.

Die Ausgangsknotenmenge enthï¿½lt alle Knoten, die zum Kontextknoten in der durch die Achse angegebenen Beziehung stehen und die den im Knotentest spezifizierten Knotentyp und erweiterten Namen besitzen. Zum Beispiel wï¿½hlt der Lokalisierungsschritt descendant::para alle para-Nachkommen des Kontextknotens aus: descendant besagt, dass jeder Knoten in der Ausgangsknotenmenge ein Nachkomme des Kontextknotens sein muss; para besagt, dass jeder Knoten in der Ausgangsknotenmenge ein Element mit dem Namen para sein muss. Die verfï¿½gbaren Achsen werden in [2.2 Achsen] beschrieben, die verfï¿½gbaren Knotentests in [2.3 Knotentests]. Die Bedeutung einiger Knotentests hï¿½ngt von der jeweiligen Achse ab.

Die Ausgangsknotenmenge wird durch das erste Prï¿½dikat gefiltert und ergibt eine neue Knotenmenge. Diese wird anschlieï¿½end durch das zweite Prï¿½dikat gefiltert und so weiter. Die resultierende Knotenmenge ist schlieï¿½lich die Knotenmenge, die durch den Lokalisierungsschritt ausgewï¿½hlt wird. Die Achse beeinflusst, wie der Ausdruck in jedem Prï¿½dikat berechnet wird. Die Semantik eines Prï¿½dikats ist damit bezï¿½glich einer Achse definiert (siehe [2.4 Prï¿½dikate]).

Anmerkung des ï¿½bersetzers:

Dieser letzte Satz bezieht sich auf Prï¿½dikate, die die Kontextposition und damit die Nï¿½heposition der gefilterten Knoten auswerten.

Zur Verdeutlichung der Vorgehensweise bei mehreren Prï¿½dikaten sei auf die beiden bereits diskutierten Beispiele

child::para[attribute::type="warning"][position()=5]

und

child::para[position()=5][attribute::type="warning"]

in Kapitel [2 Lokalisierungspfade] verwiesen.

Lokalisierungsschritte

[4]ï¿½ï¿½ï¿½	Step	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	AxisSpecifier NodeTest Predicate*
			\| AbbreviatedStep
[5]ï¿½ï¿½ï¿½	AxisSpecifier	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	AxisName '::'
			\| AbbreviatedAxisSpecifier

2.2 Achsen

Es stehen die folgenden Achsen zur Verfï¿½gung:

Die Achse child enthï¿½lt die Kinder des Kontextknotens.

Anmerkung des ï¿½bersetzers:

Die Kreise, die hier und bei den folgenden Achsen zur Darstellung der einzelnen Knoten genutzt werden, reprï¿½sentieren keine speziellen Knotentypen. Es kï¿½nnte sich also sowohl um Elemente als auch um Textknoten, Kommentare oder Processing Instructions handeln. Sie reprï¿½sentieren allerdings niemals Attribut- oder Namensraumknoten, da diese nur ï¿½ber eigens dafï¿½r definierte Achsen erreicht werden kï¿½nnen. Insbesondere sind es keine Kinder anderer Knoten.

Die Nummern geben die Nï¿½heposition der Knoten in der durch die Achse ausgewï¿½hlten Knotenmenge an.

Die Achse descendant enthï¿½lt die Nachkommen des Kontextknotens; ein Nachkomme ist ein Kind oder ein Kind eines Kindes usw. Die Nachkommenachse enthï¿½lt niemals Attribut- oder Namensraumknoten.

Anmerkung des ï¿½bersetzers:

Die Achse parent enthï¿½lt den Elternknoten des Kontextknotens, falls es einen gibt.

Anmerkung des ï¿½bersetzers:

Bis auf den Wurzelknoten besitzt jeder Knoten einen Elternknoten.

Die Achse ancestor enthï¿½lt die Vorfahren des Kontextknotens; die Vorfahren des Kontextknotens bestehen aus dem Elternknoten des Kontextknotens, dessen Elternknoten usw. Die Vorfahrenachse enthï¿½lt somit immer den Wurzelknoten, es sei denn, der Kontextknoten selbst ist der Wurzelknoten.

Anmerkung des ï¿½bersetzers:

Die Achse following-sibling enthï¿½lt alle nachfolgenden Geschwister des Kontextknotens; falls der Kontextknoten ein Attribut- oder Namensraumknoten ist, ist diese Achse leer.

Anmerkung des ï¿½bersetzers:

Geschwister sind die Knoten, die den gleichen Elternknoten wie der Kontextknoten besitzen.

Die Achse preceding-sibling enthï¿½lt alle vorhergehenden Geschwister des Kontextknotens; falls der Kontextknoten ein Attribut- oder Namensraumknoten ist, ist diese Achse leer.

Anmerkung des ï¿½bersetzers:

Die Achse following enthï¿½lt alle Knoten im gleichen Dokument wie der Kontextknoten, die nach dem Kontextknoten in Dokumentordnung auftreten, und zwar ohne seine Nachkommen und ohne Attribut- und Namensraumknoten.

Anmerkung des ï¿½bersetzers:

Die Achse preceding enthï¿½lt alle Knoten im gleichen Dokument wie der Kontextknoten, die vor dem Kontextknoten in Dokumentordnung auftreten, und zwar ohne seine Vorfahren und ohne Attribut- und Namensraumknoten.

Anmerkung des ï¿½bersetzers:

Die Achse attribute enthï¿½lt die Attribute des Kontextknotens; diese Achse ist leer, es sei denn, der Kontextknoten ist ein Elementknoten.
Die Achse namespace enthï¿½lt alle Namensraumknoten des Kontextknotens; diese Achse ist leer, es sei denn, der Kontextknoten ist ein Elementknoten.

Die Achse self enthï¿½lt nur den Kontextknoten selbst.

Anmerkung des ï¿½bersetzers:

Die Achse descendant-or-self enthï¿½lt den Kontextknoten sowie die Nachkommen des Kontextknotens.

Anmerkung des ï¿½bersetzers:

Die Achse ancestor-or-self enthï¿½lt den Kontextknoten sowie die Vorfahren des Kontextknotens; diese Achse enthï¿½lt somit immer den Wurzelknoten.

Anmerkung des ï¿½bersetzers:

Anmerkung: Die Achsen ancestor, descendant, following, preceding und self partitionieren ein Dokument (unter Auslassung der Attribut- und Namensraumknoten): sie ï¿½berschneiden sich nicht und enthalten zusammen alle Knoten des Dokuments.

Anmerkung des ï¿½bersetzers:

Achsen

[6]ï¿½ï¿½ï¿½	AxisName	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	'ancestor'
			\| 'ancestor-or-self'
			\| 'attribute'
			\| 'child'
			\| 'descendant'
			\| 'descendant-or-self'
			\| 'following'
			\| 'following-sibling'
			\| 'namespace'
			\| 'parent'
			\| 'preceding'
			\| 'preceding-sibling'
			\| 'self'

Anmerkung des ï¿½bersetzers:

Attribut- und Namensraumachse nehmen hier eine Sonderrolle ein. Die adressierten Knoten zeichnen sich nï¿½mlich durch einen bestimmten festen Knotentyp aus (den so genannten Hauptknotentyp). Da diese Knoten per Definition keine Kinder anderer Knoten sind, wurden die speziellen Achsen attribute und namespace definiert. Trotzdem kann sich auch an diese Achsen ein beliebiger Knotentest anschlieï¿½en (siehe [2.3 Knotentests]). Dies birgt die Gefahr, dass zwar syntaktisch korrekte, aber sinnlose Lokalisierungsschritte benutzt werden kï¿½nnen, die niemals einen Knoten auswï¿½hlen. Der Lokalisierungsschritt attribute::text(), der ï¿½ber die Attributachse einen Textknoten auswï¿½hlen soll, liefert beispielsweise immer eine leere Knotenmenge.

2.3 Knotentests

Jede Achse besitzt einen Hauptknotentyp. Falls eine Achse Elemente enthalten kann, so ist der Hauptknotentyp der Elementtyp, ansonsten ist es genau der Typ der Knoten, die die Achse enthalten kann. Das bedeutet:

Fï¿½r die Attributachse ist der Hauptknotentyp der Attributtyp.
Fï¿½r die Namensraumachse ist der Hauptknotentyp der Namensraum-Typ.
Fï¿½r alle anderen Achsen ist der Hauptknotentyp der Elementtyp.

Ein Knotentest, der ein QName ist, ist genau dann erfï¿½llt, wenn der Knotentyp (siehe [5 Datenmodell]) der Hauptknotentyp ist und einen erweiterten Namen besitzt, der gleich dem erweiterten Namen des QName ist. Beispielsweise wï¿½hlt child::para die para-Kindelemente des Kontextknotens aus. Falls der Kontextknoten keine para-Kinder besitzt, ist das Ergebnis eine leere Knotenmenge. attribute::href wï¿½hlt die href-Attribute des Kontextknotens aus. Falls der Kontextknoten keine href-Attribute besitzt, ist das Ergebnis eine leere Knotenmenge.

Anmerkung des ï¿½bersetzers:

Das Akronym QName steht fï¿½r "qualifizierter Name" und bedeutet, dass der entsprechende Name aus einem optionalen Prï¿½fix und einem lokalen Bestandteil bestehen kann. Beide Teile werden durch einen Doppelpunkt voneinander getrennt. Durch das Prï¿½fix wird der Namensraum bestimmt, zu dem der lokale Name gehï¿½rt. Im Beispiel xlink:href ist xlink das Prï¿½fix und href der lokale Bestandteil. Die obigen Beispiele verwenden Knotentests, die letztendlich nur lokale Namen sind, also keine Namensrï¿½ume berï¿½cksichtigen.

Mï¿½chte man auf das href-Attribut aus dem xlink-Namensraum zugreifen, wï¿½re also zu schreiben: attribute::xlink:href. Entsprechend greift man per preceding-sibling::xhtml:h1 auf die dem Kontextknoten vorhergehenden h1-Elemente aus dem xhtml-Namensraum zu. Schlieï¿½lich ein Beispiel fï¿½r die Namensraumachse: namespace::xlink wï¿½hlt genau den Namensraumknoten aus, der zum Prï¿½fix xlink gehï¿½rt. Der qualifizierte Name eines Namensraumknotens enthï¿½lt ï¿½brigens niemals ein Prï¿½fix, siehe [5.4 Namensraumknoten].

Wie in den Beispielen am Beginn des Kapitels bereits gezeigt wurde, eignet sich die Achse self, um innerhalb eines Prï¿½dikats bestimmte Elementtypen aus einer Knotenmenge herauszufiltern, wie z.B. in child::*[self::chapter or self::appendix]. Leider funktioniert eine analoge Vorgehensweise fï¿½r Attribut- oder Namensraumknoten nicht. Das erweist sich insbesondere bei negativen Bedingungen als hinderlich. Mï¿½chte man z.B. alle Attribute bis auf das href-Attribut auswï¿½hlen, leistet attribute::*[not(self::href)] leider nicht das Gewï¿½nschte. Dieser Ausdruck liefert nï¿½mlich nach wie vor alle Attribute. Da die self-Achse Elemente enthalten kann, ihr Hauptknotentyp somit der Elementtyp ist, sucht der Ausdruck self::href immer nach einem Element mit dem Namen href, niemals nach einem Attribut. Eine Lï¿½sung fï¿½r dieses Problem besteht in der Auswertung des Attributnamens, siehe die Funktionen name und local-name.

Ein QName im Knotentest wird in einen erweiterten Namen unter Verwendung der Namensraumdeklarationen aus dem Kontext des Ausdrucks expandiert. Dies geschieht in der gleichen Weise wie bei Elementnamen in Start- und End-Tags, allerdings mit der Ausnahme, dass ein mit xmlns deklarierter voreingestellter Namensraum nicht genutzt wird: d.h. enthï¿½lt QName kein Prï¿½fix, so ist der Namensraum-URI leer (das ist die gleiche Regel, nach der auch Attributnamen expandiert werden). Es ist ein Fehler, wenn der QName ein Prï¿½fix enthï¿½lt, fï¿½r das es keine Namensraumdeklaration im Kontext des Ausdrucks gibt.

Anmerkung des ï¿½bersetzers:

Qualifizierte Namen werden also gemï¿½ï¿½ der Namensraum-Empfehlung [XML Names] expandiert. Das bedeutet insbesondere, dass in einem XPath-Ausdruck nicht das gleiche Prï¿½fix wie im betrachteten XML-Dokument benutzt werden muss. Wichtig ist nur, dass beide Prï¿½fixe den gleichen Namensraum reprï¿½sentieren. Wenn beispielsweise das zugrunde liegende XML-Dokument ein XHTML-Dokument ist, dessen Elemente zum Namensraum http://www.w3.org/1999/xhtml gehï¿½ren, so kann beispielsweise das Dokumentelement ï¿½ber den XPath-Ausdruck /child::xhtml:html ausgewï¿½hlt werden â€“ vorausgesetzt, das Prï¿½fix xhtml wurde im Kontext des Ausdrucks an den gleichen Namensraum gebunden. Dabei ist es vï¿½llig unerheblich, welches Prï¿½fix im XHTML-Dokument benutzt wurde â€“ es ist sogar mï¿½glich, dass dort nur eine Deklaration fï¿½r den voreingestellten Namensraum vorkommt: .

Gerade in diesen Fï¿½llen ist Vorsicht geboten. Sehr leicht ï¿½bersieht man eine solche Namensraumdeklaration, die sich selbstverstï¿½ndlich auch auf alle Kindelemente auswirkt, und ist gewillt, nur den jeweiligen Elementnamen in einem Ausdruck anzugeben, z.B. bei folgender XSLT-Anweisung: . Richtig wï¿½re stattdessen (der Vollstï¿½ndigkeit halber mit Namensraumdeklaration): . Entsprechend mï¿½ssen in Lokalisierungpfaden alle Schritte vollstï¿½ndig qualifiziert sein: xhtml:div/xhtml:p.

Stellt man fest, dass XPath-Ausdrï¿½cke nach dem Einfï¿½gen einer DTD in das Originaldokument nicht mehr die richtigen Knoten zurï¿½ckliefern (was sich beispielsweise darin ï¿½uï¿½ert, dass ein XSLT-Stylesheet nicht mehr die erwartete Ausgabe liefert), ist in der Regel ebenfalls die Deklaration eines voreingestellten Namensraums die Ursache. Eine Deklaration innerhalb der DTD der Form versetzt alle Kindelemente von html ohne Prï¿½fix und auch html selbst in den XHTML-Namensraum. Ohne die DTD gehï¿½ren sie keinem Namensraum an. In solchen Fï¿½llen sollte man die Deklaration des voreingestellten Namensraums in das XML-Dokument aufnehmen, damit XPath-Ausdrï¿½cke unabhï¿½ngig von der Auswertung einer DTD immer das gleiche Ergebnis liefern.

Schlieï¿½lich sei noch einmal darauf hingewiesen, dass sich ein voreingestellter Namensraum im Kontext eines XPath-Ausdrucks nicht auf den Ausdruck auswirkt. Ein qualifizierter Name ohne Prï¿½fix adressiert damit immer ein Element oder ein Attribut, das zu keinem Namensraum gehï¿½rt. Die folgende Variante ist damit keine Alternative zum obigen Beispiel: .

Ein Knotentest * ist fï¿½r jeden Knoten des Hauptknotentyps erfï¿½llt. Beispielsweise wï¿½hlt child::* alle Kindelemente und attribute::* alle Attributknoten des Kontextknotens aus.

Anmerkung des ï¿½bersetzers:

Handelt es sich beim Kontextknoten um einen Elementknoten, so liefert der Schritt parent::* nur dann die leere Knotenmenge, wenn dieser das Dokumentelement reprï¿½sentiert. Der Elementknoten fï¿½r das Dokumentelement besitzt zwar ebenfalls einen Elternknoten, nï¿½mlich die Wurzel /, diese ist aber nicht vom Hauptknotentyp der Achse parent, dem Elementtyp.

Ein Knotentest kann in der Form NCName:* auftreten. In diesem Fall wird das Prï¿½fix wie bei einem QName unter Verwendung der Namensraumdeklarationen des Kontextes expandiert. Es ist ein Fehler, wenn es fï¿½r das Prï¿½fix keine Namensraumdeklaration im Kontext des Ausdrucks gibt. Der Knotentest ist erfï¿½llt fï¿½r jeden Knoten des Hauptknotentyps, dessen erweiterter Name den Namensraum-URI besitzt, zu dem das Prï¿½fix expandiert, unabhï¿½ngig vom lokalen Bestandteil des Namens.

Anmerkung des ï¿½bersetzers:

Beispielsweise wï¿½hlt descendant::xhtml:* alle Nachkommen aus dem xhtml-Namensraum und attribute::xlink:* alle Attribute aus dem xlink-Namensraum aus.

Diese Form von Knotentests kann in einem XSLT-Stylesheet innerhalb eines Musters z.B. dazu genutzt werden, alle Elemente eines bestimmten Namensraums in der gleichen Weise zu behandeln. Eingebettete XHTML-Elemente in einem beliebigen zu transformierenden XML-Dokument kï¿½nnen auf diese Weise einfach in die Ausgabe kopiert werden, ohne dass diese Elemente explizit benannt werden mï¿½ssen.

Der Knotentest text() ist erfï¿½llt fï¿½r jeden Textknoten. Zum Beispiel wï¿½hlt child::text() alle Textknoten aus, die Kinder des Kontextknotens sind. Analog ist der Knotentest comment() fï¿½r jeden Kommentarknoten erfï¿½llt und der Knotentest processing-instruction() fï¿½r jede Processing Instruction. Dem Test processing-instruction() kann ein Literal als Argument ï¿½bergeben werden. In diesem Fall ist der Test fï¿½r jede Processing Instruction erfï¿½llt, deren Name gleich dem Wert des ï¿½bergebenen Literals ist.

Anmerkung des ï¿½bersetzers:

Offensichtlich werden Kommentare nicht einfach ignoriert, sondern durch eigene Knoten innerhalb des XML-Baumes reprï¿½sentiert. Auf diese Weise kï¿½nnen XPath-Ausdrï¿½cke mittels comment() auch auf Kommentarknoten zugreifen. Ein Stylesheet kann damit XML-Kommentare verarbeiten und diese geeignet darstellen.

Fï¿½r Processing Instructions gibt es ebenfalls entsprechende Knoten im XML-Baum. Jede Processing Instruction besitzt einen Namen (ein Ziel), z.B. xml-stylesheet in . Wird dieser Name im Knotentest processing-instruction() angegeben, ist der entsprechende Test nur fï¿½r Processing Instructions mit gleichem Namen erfï¿½llt. Namen von Processing Instructions werden dabei nicht von Namensraumdeklarationen beeinflusst. Das Argument fï¿½r processing-instruction() ist damit kein qualifizierter Name, sondern ein Zeichenkettenliteral. Der Knotentest fï¿½r die zitierte Processing Instruction lautet z.B. processing-instruction('xml-stylesheet').

Der Knotentest node() ist fï¿½r alle Knoten jedes beliebigen Typs erfï¿½llt.

Anmerkung des ï¿½bersetzers:

Mï¿½chte man alle Knoten eines Dokuments auswï¿½hlen, kann man z.B. die folgenden Knotenmengen vereinigen: /descendant-or-self::node(), /descendant-or-self::node()/attribute::* und /descendant-or-self::node()/namespace::*.

Es wurde bereits auf die Sonderrolle von Attribut- und Namensraumknoten hingewiesen. Diese werden nicht durch einen Knotentest, sondern durch entsprechende Achsen ausgewï¿½hlt. Das hat zur Folge, dass sich zwar einfach prï¿½fen lï¿½sst, ob der Kontextknoten z.B. ein Textknoten ist (per self::text(); analog fï¿½r Element-, Kommentar- und Processing-Instruction-Knoten), allerdings funktioniert diese Methode nicht bei Attribut- und Namensraumknoten. Hier muss man stattdessen ï¿½berprï¿½fen, ob sich der Kontextknoten in der Menge der Attribut- bzw. Namensraumknoten des Elternknotens befindet, siehe [3.3 Knotenmengen].

[7]ï¿½ï¿½ï¿½	NodeTest	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	NameTest
			\| NodeType '(' ')'
			\| 'processing-instruction' '(' Literal ')'

2.4 Prï¿½dikate

Eine Achse ist entweder vorwï¿½rts- oder rï¿½ckwï¿½rtsgerichtet. Eine vorwï¿½rtsgerichtete Achse enthï¿½lt immer nur den Kontextknoten oder Knoten, die nach dem Kontextknoten im Dokument auftreten. Eine rï¿½ckwï¿½rtsgerichtete Achse enthï¿½lt immer nur den Kontextknoten oder Knoten, die vor dem Kontextknoten im Dokument auftreten. Demzufolge sind die Achsen ancestor, ancestor-or-self, preceding und preceding-sibling rï¿½ckwï¿½rtsgerichtete Achsen. Alle anderen Achsen sind vorwï¿½rtsgerichtet. Da die Achse self immer hï¿½chstens einen Knoten enthï¿½lt, hat es keine Bedeutung, ob sie als vorwï¿½rts- oder rï¿½ckwï¿½rtsgerichtete Achse betrachtet wird. Die Nï¿½heposition eines Knotens in einer Knotenmenge bezï¿½glich einer Achse ist definiert als die Position des Knotens in dieser Knotenmenge, welche in Dokumentordnung geordnet ist, wenn es sich um eine vorwï¿½rtsgerichtete Achse handelt, und welche in umgekehrter Dokumentordnung geordnet ist, wenn es sich um eine rï¿½ckwï¿½rtsgerichtete Achse handelt. Die erste Position ist 1.

Anmerkung des ï¿½bersetzers:

Diese recht komplizierte Definition bedarf einer Erlï¿½uterung. Die Knoten in einer Knotenmenge sind ungeordnet â€“ es handelt sich schlieï¿½lich um eine Menge. Allerdings kann ï¿½ber die Funktion position die Position eines Knotens in der aktuellen Knotenliste bestimmt werden. Die Reihenfolge der Knoten orientiert sich an der Reihenfolge, in der die Knoten im XML-Dokument auftreten. Bei vorwï¿½rtsgerichteten Achsen wird diese Ursprungsreihenfolge beibehalten und man spricht von Dokumentordnung. Fï¿½r rï¿½ckwï¿½rtsgerichtete Achsen wird die Reihenfolge umgekehrt und man spricht von umgekehrter Dokumentordnung.

Die obige Definition hat zur Folge, dass innerhalb eines Lokalisierungsschrittes immer der nï¿½chstgelegene Knoten die Position 1 hat. Abhï¿½ngig von der Blickrichtung kann es sich um einen unmittelbaren Vorgï¿½nger (preceding) bzw. Vorfahren (ancestor) oder aber um einen unmittelbaren Nachfolger (following) bzw. Nachkommen (descendant) handeln. Der Begriff Nï¿½heposition beschreibt damit die Nï¿½he zum Kontextknoten. Die Abbildungen zu den verschiedenen Achsen in Kapitel [2.2 Achsen] verdeutlichen die Nï¿½heposition der jeweiligen zur Achse gehï¿½renden Knoten. Genau genommen ist die parent-Achse ebenfalls rï¿½ckwï¿½rtsgerichtet, allerdings enthï¿½lt diese wie self maximal einen Knoten.

Die Nï¿½heposition ist nur innerhalb von Prï¿½dikaten in Lokalisierungsschritten von Bedeutung, da hier die ausschlaggebende Achse bekannt ist. Die in [4.2 Zeichenkettenfunktionen] vorgestellte Funktion string (ebenso wie die Funktionen number und boolean) konvertiert dagegen bei einer Knotenmenge immer den ersten Knoten bezï¿½glich der Dokumentordnung, unabhï¿½ngig davon, auf welchem Weg diese Knotenmenge gebildet wurde.

Fï¿½r vorwï¿½rtsgerichtete Achsen gilt daher folgende Gleichheit (am Beispiel following):

string(following::p) = string(following::p[position()=1])

Dies ist bei rï¿½ckwï¿½rtsgerichteten Achsen nicht der Fall. Stattdessen gilt hier (am Beispiel preceding):

string(preceding::p) = string(preceding::p[position()=last()])

Die XSLT-Anweisung xsl:value-of verwendet implizit die Funktion string, um einen Textknoten zu generieren. Will man also auf den Wert des ersten Knotens einer rï¿½ckwï¿½rtsgerichteten Achse zugreifen, muss man diesen immer explizit durch ein Prï¿½dikat auswï¿½hlen. Die Ausgabe des Wertes eines Attributs id des Vorgï¿½ngerknotens erfolgt daher z.B. durch .

Fï¿½r Attribute und Namensraumknoten ist die Diskussion um Position und Richtung bedeutungslos. Das liegt daran, dass die Reihenfolge, in der Attribute und Namensraumdeklarationen im Start-Tag eines Elements angegeben wurden, als irrelevant angesehen wird. Informationen darï¿½ber sind daher nicht mehr im XML-Baum enthalten.

Ein Prï¿½dikat filtert eine Knotenmenge bezï¿½glich einer Achse und produziert damit eine neue Knotenmenge. Fï¿½r jeden zu filternden Knoten der Knotenmenge wird der dazugehï¿½rige Ausdruck PredicateExpr berechnet, und zwar mit diesem Knoten als Kontextknoten, der Anzahl der Knoten der Knotenmenge als Kontextgrï¿½ï¿½e und mit der Nï¿½heposition des Knotens in der Knotenmenge bezï¿½glich der Achse als Kontextposition. Falls die Berechnung von PredicateExpr fï¿½r diesen Knoten wahr ergibt, wird der Knoten in die Ergebnisknotenmenge aufgenommen, andernfalls nicht.

Anmerkung des ï¿½bersetzers:

Diese Definition soll anhand eines Beispiels veranschaulicht werden:

ancestor::person[position() >= 2]

Achse und Knotentest ancestor::person liefern die Menge aller person-Elemente, die Vorfahren des Kontextknotens sind. Fï¿½r jeden dieser Elementknoten wird nun der Ausdruck position() >= 2 berechnet. Die Kontextgrï¿½ï¿½e ist dabei die Anzahl aller person-Vorfahren. Da ancestor eine rï¿½ckwï¿½rtsgerichtete Achse ist, werden die Knoten entgegen der Originalreihenfolge nummeriert. Damit werden alle person-Elementknoten bis auf den ersten (d.h. den nï¿½chsten) in die Ergebnisknotenmenge aufgenommen. Da als Knotentest des Lokalisierungsschrittes person verwendet wurde (und nicht *), muss es sich bei diesem ersten person-Elementknoten nicht um den Elternknoten handeln. Wï¿½rde sich ein weiteres Prï¿½dikat an den obigen Ausdruck anschlieï¿½en, wï¿½re die gerade berechnete Ergebnisknotenmenge Ausgangspunkt fï¿½r dieses Prï¿½dikat.

Falls der Ausdruck eines nachfolgenden Prï¿½dikats nicht auf Kontextgrï¿½ï¿½e oder -position zugreift, kann dieser Ausdruck bereits im ersten Prï¿½dikat berechnet und ï¿½ber den logischen Operator and mit dem dortigen Ausdruck verbunden werden. Der Lokalisierungsschritt

child::chapter[child::title][attribute::type="warning"]

liefert damit die gleiche Knotenmenge wie

child::chapter[child::title and attribute::type="warning"]

Ein PredicateExpr wird durch Berechnung des Expr und anschlieï¿½ender Konvertierung des Ergebnisses in einen booleschen Wert bestimmt. Falls das Ergebnis eine Zahl war, wird es fï¿½r den Fall, dass diese Zahl gleich der Kontextposition ist, in den Wert wahr konvertiert, ansonsten in den Wert falsch. Wenn das Ergebnis keine Zahl war, dann wird es so konvertiert wie bei einem Aufruf der Funktion boolean. Damit ist ein Lokalisierungspfad para[3] ï¿½quivalent zu para[position()=3].

Anmerkung des ï¿½bersetzers:

Da die abgekï¿½rzte Syntax erst im folgenden Kapitel beschrieben wird, sollte als Beispiel hier besser child::para[3] verwendet werden.

Fï¿½r Zahlen als Wert eines PredicateExpr gilt hier eine Sonderregel. Diese ermï¿½glicht eine Schreibweise, die dem Zugriff auf Feldelemente in anderen Programmiersprachen gleicht. Allerdings muss beachtet werden, dass ein Ausdruck child::para[$num] nur dann gleichbedeutend mit child::para[position()=$num] ist, wenn die Variable num tatsï¿½chlich eine Zahl, also ein Objekt vom Typ number enthï¿½lt. Wenn sie stattdessen nur eine geeignete Zeichenkette enthï¿½lt, wird der Variableninhalt gemï¿½ï¿½ der Funktion boolean in einen booleschen Wert konvertiert. Das Gleiche gilt fï¿½r jedes andere Objekt, das sich in eine Zahl konvertieren lieï¿½e.

Prï¿½dikate

[8]ï¿½ï¿½ï¿½	Predicate	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	'[' PredicateExpr ']'
[9]ï¿½ï¿½ï¿½	PredicateExpr	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	Expr

2.5 Abgekï¿½rzte Syntax

Zunï¿½chst einige Beispiele fï¿½r Lokalisierungspfade, die die abgekï¿½rzte Syntax benutzen:

para wï¿½hlt die para-Kindelemente des Kontextknotens aus.
* wï¿½hlt alle Kindelemente des Kontextknotens aus.
text() wï¿½hlt alle Textknoten aus, die Kinder des Kontextknotens sind.
@name wï¿½hlt das Attribut name des Kontextknotens aus.
@* wï¿½hlt alle Attribute des Kontextknotens aus.
para[1] wï¿½hlt das erste para-Kindelement des Kontextknotens aus.
para[last()] wï¿½hlt das letzte para-Kindelement des Kontextknotens aus.
*/para wï¿½hlt alle para-Enkelelemente des Kontextknotens aus.
/doc/chapter[5]/section[2] wï¿½hlt das zweite section-Element des fï¿½nften chapter-Elements von doc aus.
chapter//para wï¿½hlt die para-Elemente aus, die Nachkommen der chapter-Kindelemente des Kontextknotens sind.
//para wï¿½hlt alle para-Nachkommen der Dokumentwurzel aus und somit alle para-Elemente im gleichen Dokument wie der Kontextknoten.
//olist/item wï¿½hlt all die item-Elemente aus dem gleichen Dokument wie der Kontextknoten aus, die ein olist-Elternelement besitzen.
. wï¿½hlt den Kontextknoten aus.
.//para wï¿½hlt die para-Elemente aus, die Nachkommen des Kontextknotens sind.
.. wï¿½hlt den Elternknoten des Kontextknotens aus.
../@lang wï¿½hlt das Attribut lang des Elternknotens des Kontextknotens aus.
para[@type="warning"] wï¿½hlt alle para-Kindelemente des Kontextknotens aus, die ein Attribut type mit dem Wert warning besitzen.
para[@type="warning"][5] wï¿½hlt das fï¿½nfte para-Kindelement des Kontextknotens aus, das ein Attribut type mit dem Wert warning besitzt.
para[5][@type="warning"] wï¿½hlt das fï¿½nfte para-Kindelement des Kontextknotens aus, falls dieses Kind ein Attribut type mit dem Wert warning besitzt.
chapter[title="Introduction"] wï¿½hlt die chapter-Kindelemente des Kontextknotens aus, die ein oder mehrere title-Kindelemente mit einem Zeichenkettenwert gleich Introduction besitzen.
chapter[title] wï¿½hlt die chapter-Kindelemente des Kontextknotens aus, die ein oder mehrere title-Kindelemente besitzen.
employee[@secretary and @assistant] wï¿½hlt alle employee-Kindelemente des Kontextknotens aus, die sowohl ein Attribut secretary als auch ein Attribut assistant besitzen.

Die wichtigste Abkï¿½rzung besteht darin, dass child:: in einem Lokalisierungsschritt weggelassen werden kann. Die Standardachse ist also child. So steht beispielsweise ein Lokalisierungspfad div/para abkï¿½rzend fï¿½r child::div/child::para.

Fï¿½r Attribute gibt es ebenfalls eine Abkï¿½rzung: attribute:: kann zu @ abgekï¿½rzt werden. Ein Lokalisierungspfad para[@type="warning"] steht beispielsweise abkï¿½rzend fï¿½r child::para[attribute::type="warning"] und wï¿½hlt damit para-Kindelemente mit einem Attribut type aus, dessen Wert gleich warning ist.

// ist die Abkï¿½rzung fï¿½r /descendant-or-self::node()/. Zum Beispiel steht //para abkï¿½rzend fï¿½r /descendant-or-self::node()/child::para und wï¿½hlt damit alle para-Elemente im Dokument aus (selbst ein para-Element, das ein Dokumentelement ist, wird durch //para ausgewï¿½hlt, da der Dokumentelementknoten ein Kind des Wurzelknotens ist). div//para steht abkï¿½rzend fï¿½r div/descendant-or-self::node()/child::para und wï¿½hlt daher alle para-Nachfolger von div-Kindern aus.

Anmerkung des ï¿½bersetzers:

Hier enthï¿½lt das Originaldokument einen kleinen Fehler. Der vollstï¿½ndige Lokalisierungspfad fï¿½r das letzte Beispiel muss child::div/descendant-or-self::node()/child::para lauten.

Anmerkung: Der Lokalisierungspfad //para[1] bedeutet nicht das Gleiche wie /descendant::para[1]. Der zweite wï¿½hlt das erste Nachkommenelement para aus, der erste wï¿½hlt alle para-Nachkommen aus, die das erste Kind ihrer Eltern sind.

Anmerkung des ï¿½bersetzers:

Davon kann man sich durch Bestimmung des vollstï¿½ndigen Ausdrucks leicht ï¿½berzeugen:

//para[1] = /descendant-or-self::node()/para[1]
          = /descendant-or-self::node()/child::para[1]

Das Prï¿½dikat [1] wirkt damit auf die durch die child-Achse im zweiten Lokalisierungsschritt bestimmte Knotenmenge, wogegen es in /descendant::para[1] zur descendant-Achse gehï¿½rt.

Ein Lokalisierungsschritt . steht abkï¿½rzend fï¿½r self::node(). Das ist insbesondere in Verbindung mit // nï¿½tzlich. Der Lokalisierungspfad .//para steht zum Beispiel abkï¿½rzend fï¿½r

self::node()/descendant-or-self::node()/child::para

und wï¿½hlt daher alle para-Elemente aus, die Nachkommen des Kontextknotens sind.

Analog steht der Lokalisierungsschritt .. abkï¿½rzend fï¿½r parent::node(). Zum Beispiel steht ../title abkï¿½rzend fï¿½r parent::node()/child::title und wï¿½hlt damit die title-Kindelemente des Elternknotens des Kontextknotens aus.

Anmerkung des ï¿½bersetzers:

Die Kombination aus . und / ist unnï¿½tig und kann weggelassen werden. Ausdrï¿½cke der Form ./title oder ./@name kï¿½nnen kï¿½rzer als title bzw. @name geschrieben werden.

Ein Blick in die unten stehende Grammatik zeigt, dass es sich bei . und .. um vollstï¿½ndige Lokalisierungsschritte handelt. Ihnen kï¿½nnen also keine Prï¿½dikate folgen. Ausdrï¿½cke der Form .[self::par] oder ..[@name='foo'] sind nicht zulï¿½ssig.

Abkï¿½rzungen

[10]ï¿½ï¿½ï¿½	AbbreviatedAbsoluteLocationPath	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	'//' RelativeLocationPath
[11]ï¿½ï¿½ï¿½	AbbreviatedRelativeLocationPath	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	RelativeLocationPath '//' Step
[12]ï¿½ï¿½ï¿½	AbbreviatedStep	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	'.'
			\| '..'
[13]ï¿½ï¿½ï¿½	AbbreviatedAxisSpecifier	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	'@'?

3 Ausdrï¿½cke

3.1 Grundlagen

Eine Variablenreferenz (VariableReference) ergibt den Wert, der an den Variablennamen innerhalb der Menge der Variablenbelegungen des Kontexts gebunden ist. Es ist ein Fehler, falls dem Variablennamen in der Menge der Variablenbelegungen aus dem Kontext des Ausdrucks kein Wert zugewiesen wurde.

Anmerkung des ï¿½bersetzers:

Der Name einer Variablen ist ein qualifizierter Name, kann also ein Prï¿½fix enthalten, das auf einen Namensraum verweist. Mittels des Zeichens $ wird auf den Wert einer Variablen zugegriffen.

Der letzte Satz des obigen Abschnitts bedeutet, dass Variablen vor ihrer Benutzung definiert worden sein mï¿½ssen. Wie bereits erwï¿½hnt, sieht XPath dafï¿½r keinerlei Sprachelemente vor. In [XSLT] verwendete Variablen haben immer einen definierten Wert. So wird durch das leere Element eine Variable namens foo:var definiert und mit der leeren Zeichenkette belegt.

Zum Gruppieren kï¿½nnen runde Klammern verwendet werden.

[14]ï¿½ï¿½ï¿½	Expr	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	OrExpr
[15]ï¿½ï¿½ï¿½	PrimaryExpr	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	VariableReference
			\| '(' Expr ')'
			\| Literal
			\| Number
			\| FunctionCall

3.2 Funktionsaufrufe

Ein Ausdruck, der ein Funktionsaufruf (FunctionCall) ist, wird ausgewertet, indem anhand des Funktionsnamens (FunctionName) die Funktion in der Funktionsbibliothek des Ausdruckskontexts bestimmt, jedes der Argumente (Argument) berechnet und in den von der Funktion erwarteten Typ konvertiert und schlieï¿½lich die Funktion mit den konvertierten Argumenten aufgerufen wird. Es ist ein Fehler, wenn eine falsche Anzahl von Argumenten ï¿½bergeben wird oder eines der Argumente nicht in den geforderten Typ konvertiert werden kann. Das Ergebnis des Funktionsaufrufes (FunctionCall) ist der von der Funktion zurï¿½ckgelieferte Wert.

Die Konvertierung eines Arguments in den Typ string geschieht so wie beim Aufruf der Funktion string. Die Konvertierung eines Arguments in den Typ number geschieht so wie beim Aufruf der Funktion number. Die Konvertierung eines Arguments in den Typ boolean geschieht so wie beim Aufruf der Funktion boolean. Ein Argument, das nicht vom Typ node-set ist, kann nicht in eine Knotenmenge konvertiert werden.

Anmerkung des ï¿½bersetzers:

Dieser letzte Satz stimmt insofern, als es keine automatische Konvertierung in eine Knotenmenge gibt. Zusï¿½tzliche Funktionen kï¿½nnen durchaus Werte anderer Typen als Parameter entgegennehmen und eine Knotenmenge zurï¿½ckliefern. In vielen XSLT-1.0-konformen Prozessoren existiert beispielsweise eine Erweiterungsfunktion node-set, die fï¿½r einen Ergebnisteilbaum dessen ï¿½quivalente Knotenmenge zurï¿½ckliefert.

[16]ï¿½ï¿½ï¿½	FunctionCall	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	FunctionName '(' ( Argument ( ',' Argument )* )? ')'
[17]ï¿½ï¿½ï¿½	Argument	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	Expr

3.3 Knotenmengen

Ein Lokalisierungspfad kann als Ausdruck benutzt werden. Ein solcher Ausdruck liefert die durch den Pfad ausgewï¿½hlte Knotenmenge.

Der Operator | berechnet die Vereinigung seiner Operanden, welche jeweils Knotenmengen sein mï¿½ssen.

Anmerkung des ï¿½bersetzers:

Da es sich um eine Vereinigung von Mengen handelt, ist ein identischer Knoten in beiden Operanden in der Ergebnisknotenmenge auch nur einmal vorhanden. Zusammen mit der Funktion count (siehe [4.1 Funktionen auf Knotenmengen]) lï¿½sst sich so die Identitï¿½t zweier Knoten feststellen.

Die Knotenmenge $a ist in der Knotenmenge $b enthalten, falls count($b) = count($a | $b). $a und $b sind identisch, wenn $a in $b und $b in $a enthalten ist. Es handelt sich um einzelne Knoten, wenn auï¿½erdem count($a) = 1 ist. Achtung: Der Operator = bestimmt die Gleichheit der Zeichenkettenwerte zweier Knoten (siehe [3.4 Boolesche Werte]), nicht deren Identitï¿½t.

XPath definiert keine Operatoren fï¿½r die Bestimmung von Durchschnitt und Differenz zweier Knotenmengen. Basierend auf dem Teilmengentest lassen sich diese Operationen allerdings berechnen:

Durchschnitt von $a und $b:

$a[count(.|$b) = count($b)]

Differenz von $a und $b:

$a[count(.|$b) != count($b)]

Damit lï¿½sst sich nun auch testen, ob der Kontextknoten ein Attributknoten ist (analog fï¿½r Namensraumknoten):

count(.|../@*) = count(../@*)

Die bedingte Auswahl einer Knotenmenge aus zwei Alternativen abhï¿½ngig von einem logischen Ausdruck kann durch folgende Konstruktion erreicht werden:

node-set1[boolean-test] | node-set2[not(boolean-test)]

In den Programmiersprachen C, C++ und Java stellt der Fragezeichenoperator ?: diese Funktionalitï¿½t bereit. Eine analoge Anwendung fï¿½r Zeichenketten wird im Zusammenhang mit der Funktion substring in Kapitel [4.2 Zeichenkettenfunktionen] vorgestellt.

In XSLT-Mustern, die eine Teilmenge der XPath-Ausdrï¿½cke bilden, wird der Operator | verwendet, um mï¿½gliche Alternativen anzugeben.

Prï¿½dikate werden zum Filtern von Ausdrï¿½cken in der gleichen Weise wie in Lokalisierungspfaden benutzt. Es ist ein Fehler, falls das Ergebnis des zu filternden Ausdrucks keine Knotenmenge ist. Das Prï¿½dikat filtert die Knotenmenge bezï¿½glich der Kindachse.

Anmerkung: Die Bedeutung eines Prï¿½dikats hï¿½ngt entscheidend davon ab, welche Achse angewendet wird. Zum Beispiel liefert preceding::foo[1] das erste foo-Element in umgekehrter Dokumentordnung, weil die fï¿½r das Prï¿½dikat [1] anzuwendende Achse die Vorgï¿½ngerachse (preceding) ist. Demgegenï¿½ber liefert (preceding::foo)[1] das erste foo-Element in Dokumentordnung, weil die Achse, die in diesem Fall fï¿½r das Prï¿½dikat [1] gilt, die Kindachse ist.

Anmerkung des ï¿½bersetzers:

Auf diesen Unterschied soll noch einmal deutlich hingewiesen werden: Prï¿½dikate, die Bestandteil eines Lokalisierungsschrittes sind, filtern eine Knotenmenge bezï¿½glich der im Lokalisierungsschritt verwendeten Achse. Fï¿½r jeden Knoten der Knotenmenge ist daher dessen Nï¿½heposition relevant. Prï¿½dikate, die auf einen XPath-Ausdruck angewendet werden, interpretieren die betreffenden Knoten immer in Dokumentordnung, da laut Definition in solch einem Fall die Kindachse anzuwenden ist.

Im obigen Beispiel preceding::foo[1] ist das Prï¿½dikat [1] Bestandteil des Lokalisierungsschrittes preceding::foo[1], wï¿½hrend bei (preceding::foo)[1] das Prï¿½dikat [1] auf den Ausdruck (preceding::foo) angewendet wird (welcher in diesem Fall ein Lokalisierungsschritt ohne Prï¿½dikat ist).

Das folgende Beispiel stellt den Sachverhalt aus einer praxisnï¿½heren Sicht dar. Es gibt zwar die Achse ancestor-or-self, welche neben allen Vorfahren auch den Kontextknoten auswï¿½hlt, es gibt aber keine entsprechende Achse preceding-or-self, die alle Vorgï¿½nger inklusive des Kontextknotens auswï¿½hlen kï¿½nnte. Die gewï¿½nschte Knotenmenge muss also durch eine Vereinigung konstruiert werden: preceding::node() | self::node(). Bei der Anwendung eines oder mehrerer Prï¿½dikate auf die entstehende Menge, etwa (preceding::node() | .)[@id][1], muss man beachten, dass die Knoten nun in Dokumentordnung gefiltert werden. Der Ausdruck liefert damit den ersten Knoten im Dokument, der ein Vorgï¿½nger des Kontextknotens ist und ein Attribut id besitzt, und nicht den zum Kontextknoten nï¿½chsten Knoten mit dieser Eigenschaft.

Bei der Betrachtung des Beispiels (preceding-sibling::* | following-sibling::*)[1] wird klar, dass fï¿½r solche Ausdrï¿½cke eine von den beteiligten Achsen abhï¿½ngende Knotenordnung nicht praktikabel ist.

An dieser Stelle sei darauf hingewiesen, dass ï¿½ber die in [XSLT] definierte Funktion document auch Knotenmengen aus verschiedenen Dokumenten miteinander vereinigt werden kï¿½nnen. In diesem Fall gibt es keine definierte Dokumentordnung fï¿½r die Vereinigungsmenge mehr. Die Anwendung eines entsprechenden Prï¿½dikats ist damit implementationsabhï¿½ngig. Entsprechendes gilt bei einer Knotenmenge, die die Attribute eines Elements enthï¿½lt.

Die Operatoren / und // verbinden einen Ausdruck und einen relativen Lokalisierungspfad. Es ist ein Fehler, wenn die Berechnung des Ausdrucks keine Knotenmenge ergibt. Der Operator / arbeitet dabei in der gleichen Weise wie in einem Lokalisierungspfad. Ebenso wie in Lokalisierungspfaden steht // abkï¿½rzend fï¿½r /descendant-or-self::node()/.

Es gibt keine Objekte, die in eine Knotenmenge konvertiert werden kï¿½nnen.

Anmerkung des ï¿½bersetzers:

Angenommen, eine Variable namens divs enthï¿½lt eine Knotenmenge von diversen div-Elementen (div1, div2, etc). Dann kann mittels $divs[1] auf das erste dieser Elemente zugegriffen werden. $divs/@id liefert die Menge der id-Attributknoten der Elemente aus $divs, $divs//image liefert die Menge aller image-Elemente, die Nachkommen eines in $divs enthaltenen div-Elements sind.

Dabei ist zu beachten, dass sich einem Ausdruck anschlieï¿½ende Lokalisierungsschritte immer auf die Position der Knoten im XML-Dokument beziehen und nicht auf die durch den Ausdruck berechnete Knotenmenge. Beispielsweise bestimmt $divs[1]/following-sibling::* den nachfolgenden Geschwisterknoten des ersten Knotens aus $divs im XML-Dokument, und nicht den "Nachfolger" in $divs, also $divs[2]. Allgemein gesprochen gibt es keinen Weg, der es erlaubt, ausgehend von einem Kontextknoten, der Element einer zuvor bestimmten Knotenmenge ist, auf die anderen Knoten dieser Menge zuzugreifen. Das betrifft insbesondere Ausdrï¿½cke, die in Prï¿½dikaten oder im Kï¿½rper der XSLT-Anweisung xsl:for-each auftreten.

Ausdrï¿½cke, speziell Variablen, dï¿½rfen nur vor / und // auftreten. Es ist nicht mï¿½glich, Ausdrï¿½cke dynamisch zusammenzusetzen, wie man es etwa mit /root/$element versuchen kï¿½nnte. Eine Mï¿½glichkeit, innerhalb eines Pfades dynamisch ein bestimmtes Element auszuwï¿½hlen, wird im Zusammenhang mit der Funktion name vorgestellt.

Wie schon gesagt wurde, muss ein Ausdruck, dem ein Prï¿½dikat oder einer der Operatoren / und // folgt, immer eine Knotenmenge als Ergebnis liefern. Da Objekte anderer Typen nicht in eine Knotenmenge konvertiert werden kï¿½nnen, fï¿½hrt die Auswertung eines Ausdrucks, der keine Knotenmenge ergibt, in diesem Fall zu einem Fehler. XPath nutzende Spezifikationen und Implementationen kï¿½nnen jedoch explizit zusï¿½tzliche Funktionen definieren, die beliebige Objekte in Knotenmengen ï¿½berfï¿½hren.

[18]ï¿½ï¿½ï¿½	UnionExpr	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	PathExpr
			\| UnionExpr '\|' PathExpr
[19]ï¿½ï¿½ï¿½	PathExpr	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	LocationPath
			\| FilterExpr
			\| FilterExpr '/' RelativeLocationPath
			\| FilterExpr '//' RelativeLocationPath
[20]ï¿½ï¿½ï¿½	FilterExpr	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	PrimaryExpr
			\| FilterExpr Predicate

3.4 Boolesche Werte

Ein Objekt vom Typ boolean kann zwei Werte annehmen, wahr und falsch.

Die Berechnung eines or-Ausdrucks erfolgt, indem jeder der Operanden berechnet und in einen booleschen Wert wie beim Aufruf der Funktion boolean konvertiert wird. Das Ergebnis ist der Wert wahr, wenn einer der beiden Werte wahr ist, und andernfalls falsch. Der rechte Operand wird nicht mehr ausgewertet, wenn der linke Operand wahr ergibt.

Die Berechnung eines and-Ausdrucks erfolgt, indem jeder der Operanden berechnet und in einen booleschen Wert wie beim Aufruf der Funktion boolean konvertiert wird. Das Ergebnis ist der Wert wahr, wenn beide Werte wahr sind, und andernfalls falsch. Der rechte Operand wird nicht mehr ausgewertet, wenn der linke Operand falsch ergibt.

Anmerkung des ï¿½bersetzers:

Mit dieser Regelung lï¿½sst sich die Berechnung von Teilausdrï¿½cken und der Aufruf enthaltener Funktionen verhindern. Abgesehen von Performance-Aspekten hat sie im Zusammenhang mit XSLT allerdings nicht die gleiche Bedeutung wie in anderen Programmiersprachen.

So arbeiten alle XSLT-Funktionen ohne Seiteneffekte (sie produzieren weder Ausgaben noch ï¿½ndern sie Variableninhalte); Funktionsparameter werden automatisch in den geforderten Typ konvertiert und mathematische Operationen liefern immer einen definierten Wert. Lediglich Typfehler kï¿½nnen auftreten, falls ein Ausdruck als Operand oder Funktionsparameter eine Knotenmenge verlangt. Allerdings gibt es in XPath keine Mï¿½glichkeit festzustellen, ob ein Teilausdruck vom Typ Knotenmenge ist.

Da sich ï¿½ber Erweiterungsmechanismen jedoch Funktionen definieren lassen, die die genannten Eigenschaften nicht mehr besitzen, kann ï¿½ber eine Verknï¿½pfung mit or oder and der Aufruf solcher Funktionen bei Bedarf verhindert werden.

Die Berechnung eines EqualityExpr-Ausdrucks (der nicht allein ein RelationalExpr-Ausdruck ist) oder eines RelationalExpr-Ausdrucks (der nicht allein ein AdditiveExpr-Ausdruck ist) geschieht, indem die Objekte miteinander verglichen werden, die im Ergebnis der Auswertung der beiden Operanden entstehen. Die folgenden drei Absï¿½tze definieren den Vergleich zwischen den daraus resultierenden Objekten. Erst werden Vergleiche, die Knotenmengen betreffen, ï¿½ber Vergleiche definiert, die keine Knotenmengen betreffen; dies geschieht einheitlich fï¿½r =, !=, <=, <, >= und >. Dann werden Vergleiche, die keine Knotenmengen betreffen, fï¿½r = und != definiert. Schlieï¿½lich werden Vergleiche, die keine Knotenmengen betreffen, fï¿½r <=, <, >= und > definiert.

Wenn beide zu vergleichenden Objekte Knotenmengen sind, so liefert ein Vergleich genau dann den Wert wahr, wenn es einen Knoten aus der ersten Knotenmenge und einen Knoten aus der zweiten Knotenmenge gibt, sodass das Ergebnis des Vergleichs der Zeichenkettenwerte dieser beiden Knoten wahr ergibt. Wenn eines der zu vergleichenden Objekte eine Knotenmenge und das andere eine Zahl ist, dann liefert ein Vergleich genau dann den Wert wahr, wenn es einen Knoten in der Knotenmenge gibt, sodass der Vergleich zwischen der Zahl und dem Ergebnis der Konvertierung des Zeichenkettenwerts dieses Knotens zu einer Zahl ï¿½ber die Funktion number wahr ergibt. Wenn eines der zu vergleichenden Objekte eine Knotenmenge und das andere eine Zeichenkette ist, dann liefert ein Vergleich genau dann den Wert wahr, wenn es einen Knoten in der Knotenmenge gibt, sodass der Vergleich zwischen der Zeichenkette und dem Zeichenkettenwert dieses Knotens wahr ergibt. Wenn eines der zu vergleichenden Objekte eine Knotenmenge und das andere ein boolescher Wert ist, dann liefert ein Vergleich genau dann den Wert wahr, wenn es einen Knoten in der Knotenmenge gibt, sodass der Vergleich zwischen dem booleschen Wert und dem Ergebnis der Konvertierung des Zeichenkettenwerts dieses Knotens zu einem boolschen Wert ï¿½ber die Funktion boolean wahr ergibt.

Wenn keines der zu vergleichenden Objekte eine Knotenmenge ist und als Operator = oder != vorkommt, so werden die Objekte wie nachfolgend beschrieben in einen gemeinsamen Typ konvertiert und anschlieï¿½end verglichen. Wenn wenigstens eines der zu vergleichenden Objekte ein boolescher Wert ist, wird jedes Objekt wie bei der Anwendung der Funktion boolean in einen booleschen Wert konvertiert. Wenn wenigstens eines der zu vergleichenden Objekte eine Zahl ist, wird jedes Objekt wie bei der Anwendung der Funktion number in eine Zahl konvertiert. Andernfalls werden beide Objekte wie bei der Anwendung der Funktion string in Zeichenketten konvertiert. Der Vergleich = liefert als Ergebnis genau dann den Wert wahr, wenn beide Objekte gleich sind; der Vergleich != liefert als Ergebnis genau dann den Wert wahr, wenn beide Objekte ungleich sind. Zahlen werden gemï¿½ï¿½ IEEE 754 [IEEE 754] verglichen. Zwei boolesche Werte sind gleich, wenn sie entweder beide wahr oder beide falsch sind. Zwei Zeichenketten sind genau dann gleich, wenn sie aus derselben Folge von UCS-Zeichen bestehen.

Anmerkung: Wenn $x mit einer Knotenmenge belegt ist, dann bedeutet $x="foo" nicht dasselbe wie not($x!="foo"): Der erste Vergleich ergibt genau dann wahr, wenn ein Knoten in $x den Zeichenkettenwert foo hat; der zweite ergibt genau dann wahr, wenn alle Knoten in $x den Zeichenkettenwert foo haben.

Anmerkung des ï¿½bersetzers:

Der Vergleich $x!="foo" ist genau dann wahr, wenn es wenigstens einen Knoten aus $x gibt, fï¿½r den die Ungleichheit gilt, d.h. falsch, wenn es keinen solchen Knoten gibt. Damit ist not($x!="foo") wahr, wenn es keinen Knoten aus $x gibt, dessen Zeichenkettenwert verschieden von foo ist, d.h. wenn alle Knoten den Zeichenkettenwert foo besitzen.

Ein hï¿½ufigerer Fall dï¿½rfte der Test auf Ungleichheit sein. Man mï¿½chte z.B. feststellen, ob der Wert eines Ausdrucks verschieden von allen Kindelementen entry ist. Die Lï¿½sung lautet in diesem Fall nicht entry!="foo" (hier wird auf alle entry-Kindelemente zugegriffen und getestet, ob unter diesen eines existiert, das verschieden von der Zeichenkette "foo" ist), sondern not(entry="foo").

Bemerkenswert ist noch der Fall, dass die beteiligte Knotenmenge leer ist. Ein Vergleich @type!="warning" ist falsch, wenn kein Attribut type existiert. Dagegen liefert not(@type="warning") in diesem Fall den Wert wahr.

Es sei noch einmal darauf hingewiesen, dass fï¿½r Knotenmengen mit den Operatoren = und != nicht die Identitï¿½t von Knoten getestet wird, sondern die ihrer Zeichenkettenwerte. Zwei Knoten kï¿½nnen unter Zuhilfenahme des Operators | auf Identitï¿½t getestet werden, siehe Anmerkung in Kapitel [3.3 Knotenmengen].

Wenn keines der zu vergleichenden Objekte eine Knotenmenge ist und als Operator <=, <, >= oder > vorkommt, so werden beide Objekte in Zahlen konvertiert und anschlieï¿½end gemï¿½ï¿½ IEEE 754 verglichen. Der Vergleich < ergibt genau dann den Wert wahr, wenn die erste Zahl kleiner als die zweite Zahl ist. Der Vergleich <= ergibt genau dann den Wert wahr, wenn die erste Zahl kleiner oder gleich der zweiten Zahl ist. Der Vergleich > ergibt genau dann den Wert wahr, wenn die erste Zahl grï¿½ï¿½er als die zweite Zahl ist. Der Vergleich >= ergibt genau dann den Wert wahr, wenn die erste Zahl grï¿½ï¿½er oder gleich der zweiten Zahl ist.

Anmerkung des ï¿½bersetzers:

Somit sind Vergleiche, an denen Knotenmengen beteiligt sind, dann erfï¿½llt, wenn sich wenigstens ein Knoten aus der jeweiligen Menge finden lï¿½sst, dessen Zeichenkettenwert den Vergleich erfï¿½llt. Insbesondere liefert der Vergleich mit wenigstens einer leeren Menge in jedem Fall den Wert falsch. Sind nur Werte verschiedener skalarer Typen beteiligt, so wird in der Rangfolge "boolescher Wert â€“ Zahl â€“ Zeichenkette" ein gemeinsamer Typ gesucht und der jeweils andere Wert konvertiert. Grï¿½ï¿½envergleiche sind nur fï¿½r Zahlen definiert.

Unter Ausnutzung dieser Regeln kann z.B. die kleinste Zahl in einer Knotenmenge $set folgendermaï¿½en bestimmt werden:

$set[not(. > $set)]

Ein Vergleich mit dem speziellen Zahlenwert NaN (Not a Number) liefert immer den Wert falsch, selbst bei number('NaN')=number('NaN'). Bei 'NaN' handelt es sich hier nicht um eine spezielle Zeichenkette, die in den Wert NaN konvertiert wird, sondern einfach um eine, die sich nicht konvertieren lï¿½sst. Kï¿½nnen in der Beispielmenge $set auch Knoten auftreten, deren Zeichenkettenwert sich nicht in eine Zahl konvertieren lï¿½sst, kï¿½nnte man den obigen Ausdruck auf folgende, etwas unkonventionelle Weise vervollstï¿½ndigen:

$set[number()=number() and not(. > $set)]

Vorsicht ist geboten, wenn die Werte einer Knotenmenge vor dem Vergleich durch eine Funktion mit skalarem Argumenttyp bearbeitet werden sollen. ï¿½bergibt man der Funktion die gesamte Knotenmenge als Argument, wird nur mit dem Funktionswert des ersten Knotens verglichen. Die spezielle Semantik des Vergleichs mit Knotenmengen geht verloren. In der Anmerkung zur Funktion normalize-space wird dies an einem Beispiel ausfï¿½hrlicher erlï¿½utert.

XPath stellt keine Mï¿½glichkeit zur Verfï¿½gung, mit der man Zeichenketten lexikographisch der Grï¿½ï¿½e nach vergleichen kï¿½nnte. Abhï¿½ngig vom Anwendungsfall lassen sich in XSLT solche Vergleiche durch die Programmierung rekursiver Templates oder die Benutzung des xsl:sort-Elements realisieren.

Anmerkung: Wenn ein XPath-Ausdruck in einem XML-Dokument vorkommt, mï¿½ssen alle Operatoren < und <= gemï¿½ï¿½ den XML-1.0-Regeln geschï¿½tzt werden, zum Beispiel als < und <=. Im folgenden Beispiel ist der Wert des Attributes test ein XPath-Ausdruck:
...

[21]ï¿½ï¿½ï¿½	OrExpr	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	AndExpr
			\| OrExpr 'or' AndExpr
[22]ï¿½ï¿½ï¿½	AndExpr	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	EqualityExpr
			\| AndExpr 'and' EqualityExpr
[23]ï¿½ï¿½ï¿½	EqualityExpr	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	RelationalExpr
			\| EqualityExpr '=' RelationalExpr
			\| EqualityExpr '!=' RelationalExpr
[24]ï¿½ï¿½ï¿½	RelationalExpr	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	AdditiveExpr
			\| RelationalExpr '<' AdditiveExpr
			\| RelationalExpr '>' AdditiveExpr
			\| RelationalExpr '<=' AdditiveExpr
			\| RelationalExpr '>=' AdditiveExpr

Anmerkung: Mit der obigen Grammatik ergibt sich folgende Vorrangfolge (kleinster Vorrang zuerst):

or

and

=, !=

<=, <, >=, >

Alle Operatoren sind links-assoziativ. Beispielsweise ist 3 > 2 > 1 ï¿½quivalent zu (3 > 2) > 1, was den Wert falsch ergibt.

Anmerkung des ï¿½bersetzers:

Der Vergleich 3 > 2 ergibt zunï¿½chst den Wert wahr. Dieses Ergebnis wird aufgrund des folgenden Vergleichsoperators > in die Zahl 1 konvertiert, sodass nun 1 > 1 berechnet wird, was den Wert falsch liefert. Auf analoge Weise kann man sich ï¿½berlegen, dass der Ausdruck 2 = 1 = 0 wahr, der Ausdruck 0 = 0 = 0 hingegen falsch ergibt.

Hier ist Vorsicht geboten, da solche Ausdrï¿½cke gemï¿½ï¿½ der XPath-Grammatik erlaubt sind, aber nicht die Semantik besitzen, die man auf den ersten Blick erwarten wï¿½rde. Sie verhalten sich allerdings genauso wie beispielsweise in den Programmiersprachen C und C++.

3.5 Zahlen

Ein Wert vom Typ number reprï¿½sentiert eine Gleitkommazahl. Eine Zahl kann jeden beliebigen, doppelt-genauen 64-Bit-Wert des Formats IEEE 754 [IEEE 754] annehmen. Dies beinhaltet den speziellen Wert "Not-a-Number" (NaN), positiv und negativ unendlich, sowie positiv und negativ Null. Fï¿½r eine Zusammenfassung der wichtigsten Regeln des IEEE-754-Standards siehe Abschnitt 4.2.3 in [JLS].

Anmerkung des ï¿½bersetzers:

Die genannten speziellen Werte entstehen dann, wenn eine Rechenoperation einen ï¿½berlauf produzieren wï¿½rde bzw. das Ergebnis nicht definiert ist. Beim Rechnen mit Zahlen in XPath kï¿½nnen keine Fehler oder Ausnahmen auftreten.

An dieser Stelle sei bereits kurz auf die Produktion fï¿½r Number in [3.7 Lexikalische Struktur] hingewiesen. Zahlen in XPath sind Gleitkommazahlen ohne Exponentendarstellung. Eine Schreibweise 2.99792E+08 ist nicht zulï¿½ssig. Sie kï¿½nnen ein negatives, aber kein explizites positives Vorzeichen besitzen. Soll einer der speziellen Werte wie z.B. positiv unendlich verwendet werden, muss dieser ermittelt werden, etwa durch 1 div 0.

Es gibt in XPath weder einen speziellen Typ fï¿½r ganzzahlige Werte noch gesonderte Zahlendarstellungen, die eine Zahl als Oktal- oder Hexadezimalzahl interpretieren, wie dies in vielen Programmiersprachen mï¿½glich ist.

Die numerischen Operatoren konvertieren ihre Operanden in Zahlen, so wie bei einem Aufruf der Funktion number.

Der Operator + addiert.

Der Operator - subtrahiert.

Anmerkung des ï¿½bersetzers:

Gemï¿½ï¿½ Errata-Dokument [XPath Errata] ist die Semantik des einstelligen Operators - nicht spezifiziert. Stattdessen muss dieser letzte Absatz lauten:

Der zweistellige Operator - subtrahiert. Der einstellige Operator - berechnet die Negation. Beachten Sie, dass -0 negativ Null ergibt.

Anmerkung: Da XML innerhalb von Namen das Zeichen - erlaubt, muss der Operator - typischerweise von einem Leerraumzeichen angefï¿½hrt werden. Zum Beispiel ergibt foo-bar eine Knotenmenge, die die Kindelemente namens foo-bar enthï¿½lt; foo - bar ergibt die Differenz aus den Werten, die durch Konvertierung des Zeichenkettenwertes des ersten foo-Kindelements in eine Zahl und durch Konvertierung des Zeichenkettenwertes des ersten bar-Kindelements in eine Zahl entstehen.

Anmerkung des ï¿½bersetzers:

Gemï¿½ï¿½ Errata-Dokument [XPath Errata] ist die Semantik des Operators * nicht spezifiziert. An dieser Stelle muss folgender Absatz eingefï¿½gt werden:

Der Operator * berechnet eine Gleitkomma-Multiplikation gemï¿½ï¿½ IEEE 754. Beachten Sie: Falls das Ergebnis nicht NaN ist, ist das Ergebnis genau dann positiv, wenn beide Operanden das gleiche Vorzeichen besitzen.

Das Zeichen * dient zugleich als Knotentest zur Auswahl beliebiger Elemente. Welche Semantik ein * innerhalb eines XPath-Ausdrucks hat, hï¿½ngt damit von den umgebenden Tokens in diesem Ausdruck ab (siehe [3.7 Lexikalische Struktur]).

Der Operator div berechnet eine Gleitkomma-Division gemï¿½ï¿½ IEEE 754.

Anmerkung des ï¿½bersetzers:

Gemï¿½ï¿½ Errata-Dokument [XPath Errata] muss an dieser Stelle folgender Satz eingefï¿½gt werden:

Beachten Sie: Falls das Ergebnis nicht NaN ist, ist das Ergebnis genau dann positiv, wenn beide Operanden das gleiche Vorzeichen besitzen.

Der Schrï¿½gstrich / ist nicht der Divisionsoperator, da dieser bereits als Pfadoperator zum Verbinden von Lokalisierungsschritten sowie als Symbol fï¿½r den Wurzelknoten benutzt wird. Im Gegensatz zum Zeichen * gibt es hier nicht mehrere Interpretationsmï¿½glichkeiten.

Der Operator mod liefert den Rest einer ganzzahligen Division. Beispiele:

5 mod 2 ergibt 1
5 mod -2 ergibt 1
-5 mod 2 ergibt -1
-5 mod -2 ergibt -1

Anmerkung: mod berechnet dasselbe wie der Operator % in Java und ECMAScript.

Anmerkung: Er berechnet nicht dasselbe wie die IEEE-754-Rest-Operation, welche den Rest einer gerundeten Division liefert.

Anmerkung des ï¿½bersetzers:

Der mod-Operator berechnet den genauen Rest, der sich bei der ganzzahligen Division zweier Gleitkommazahlen ergibt, ohne die Operanden zuvor auf ganze Zahlen zu runden.

Numerische Ausdrï¿½cke

[25]ï¿½ï¿½ï¿½	AdditiveExpr	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	MultiplicativeExpr
			\| AdditiveExpr '+' MultiplicativeExpr
			\| AdditiveExpr '-' MultiplicativeExpr
[26]ï¿½ï¿½ï¿½	MultiplicativeExpr	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	UnaryExpr
			\| MultiplicativeExpr MultiplyOperator UnaryExpr
			\| MultiplicativeExpr 'div' UnaryExpr
			\| MultiplicativeExpr 'mod' UnaryExpr
[27]ï¿½ï¿½ï¿½	UnaryExpr	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	UnionExpr
			\| '-' UnaryExpr

3.6 Zeichenketten

Zeichenketten bestehen aus einer Folge von null oder mehr Zeichen, wobei Zeichen wie in der XML-Empfehlung [XML] definiert sind. Ein einzelnes XPath-Zeichen entspricht damit einem einzelnen abstrakten Unicode-Zeichen mit einem einzelnen korrespondierenden skalaren Wert (siehe [Unicode]); dies unterscheidet sich allerdings von einem 16-Bit-kodierten Unicode-Zeichen: Die durch Unicode definierte kodierte Zeichenreprï¿½sentation eines abstrakten Zeichens mit einem skalaren Wert grï¿½ï¿½er als U+FFFF ist ein Paar von 16-Bit Unicode-Codes (ein Surrogat-Paar). In vielen Programmiersprachen wird eine Zeichenkette als Folge von 16-Bit-kodierten Unicode-Zeichen reprï¿½sentiert; XPath-Implementationen in solchen Sprachen mï¿½ssen sicherstellen, dass ein Surrogat-Paar korrekt als einzelnes XPath-Zeichen behandelt wird.

Anmerkung: In Unicode ist es mï¿½glich, dass zwei Zeichenketten als identisch anzusehen sind, obwohl sie aus unterschiedlichen Folgen abstrakter Unicode-Zeichen bestehen. Zum Beispiel kï¿½nnen einige Akzentzeichen entweder in einer vordefinierten (precomposed) oder einer zerlegten (decomposed) Form reprï¿½sentiert werden. Damit kï¿½nnen XPath-Ausdrï¿½cke unerwartete Resultate liefern, es sei denn, sowohl die Zeichen im XPath-Ausdruck als auch die im XML-Dokument wurden zu einer kanonischen Form normalisiert (siehe [Character Model]).

Anmerkung des ï¿½bersetzers:

Ein zusammengesetztes Zeichen, das sich auch als vordefiniertes Zeichen kodieren lï¿½sst, wird durch einen einzigen Unicode-Code reprï¿½sentiert. Beispielsweise lï¿½sst sich der Umlaut ï¿½ï¿½ï¿½ als U+00FC darstellen. Zugleich kann dieser Buchstabe auch wie jedes zusammengesetzte Zeichen in der zerlegten Form durch die Folge der beiden Codes U+0075 (ï¿½uï¿½) und U+0308 (combining diaeresis) kodiert werden.

3.7 Lexikalische Struktur

Beim Zerlegen in einzelne Tokens wird immer das lï¿½ngstmï¿½gliche Token zurï¿½ckgeliefert.

Zur besseren Lesbarkeit kï¿½nnen Leerraumzeichen innerhalb von Ausdrï¿½cken verwendet werden, auch wenn es nicht explizit durch die Grammatik erlaubt wurde: ExprWhitespace kann innerhalb von Ausdrï¿½cken frei vor oder nach beliebigen ExprTokens eingefï¿½gt werden.

Anmerkung des ï¿½bersetzers:

An dieser Stelle sei auf die Anmerkung zum Operator fï¿½r die Subtraktion, das zweistellige Minus, in [3.5 Zahlen] hingewiesen. Der erste Absatz legt fest, dass ï¿½foo-barï¿½ nur als einzelnes Token interpretiert werden darf und nicht als Folge der Tokens ï¿½fooï¿½, ï¿½-ï¿½ und ï¿½barï¿½. Der zweite Absatz erlaubt nun explizit, beispielsweise den Minus-Operator mittels Leerraumzeichen als einzeln zu interpretierendes Token zu kennzeichnen.

ï¿½blicherweise unterscheidet man bei der Definition einer Sprache zwischen lexikalischen Produktionen, die den Aufbau der lexikalischen Einheiten, so genannter Tokens festlegen, und syntaktischen Produktionen, die die mï¿½gliche Kombination dieser Tokens zu komplexeren Konstrukten beschreiben. In der XPath-Spezifikation sind diese beiden Arten von Produktionen allerdings nicht streng voneinander abgegrenzt. Der Hauptunterschied zwischen lexikalischen und syntaktischen Produktionen besteht darin, dass zwischen einzelnen Tokens Leerraumzeichen auftreten dï¿½rfen, nicht jedoch innerhalb eines Tokens. Die Produktion fï¿½r das Nichtterminal ExprToken stellt damit die oberste lexikalische Produktion dar. Daraus ergibt sich, dass ein Leerzeichen zwischen @ und einem QName zur Abkï¿½rzung der attribute-Achse erlaubt ist, nicht aber zwischen $ und einem QName bei Variablenreferenzen.

Die folgenden speziellen Regeln fï¿½r die Zerlegung in Tokens mï¿½ssen in der angegebenen Reihenfolge angewendet werden, um die Grammatik ExprToken eindeutig zu machen:

Wenn es ein vorhergehendes Token gibt und dieses Token kein @, ::, (, [, , oder ein Operator ist, dann muss ein * als MultiplyOperator und ein NCName als OperatorName erkannt werden.
Falls das einem NCName folgende Zeichen (mï¿½glicherweise nach dazwischenliegendem ExprWhitespace) das Zeichen ( ist, dann muss das Token als NodeType oder als FunctionName erkannt werden.
Falls die einem NCName folgenden beiden Zeichen (mï¿½glicherweise nach dazwischenliegendem ExprWhitespace) die Zeichen :: sind, dann muss das Token als AxisName erkannt werden.
Andernfalls darf das Token nicht als MultiplyOperator, als OperatorName, als NodeType, als FunctionName oder als AxisName erkannt werden.

Anmerkung des ï¿½bersetzers:

Im zweiten Aufzï¿½hlungspunkt des Originaldokuments hat sich ein Fehler eingeschlichen. Da Funktionsnamen mit einem Prï¿½fix ausgestattet sein kï¿½nnen, muss laut Errata-Dokument [XPath Errata] auf QName statt auf NCName verwiesen werden. Alle Standardfunktionen aus XPath, XSLT und XPointer besitzen zwar nur Namen ohne Prï¿½fix, der Erweiterungsmechanismus in XSLT erlaubt jedoch XSLT-Implementationen, zusï¿½tzliche Funktionen aus einem proprietï¿½ren Namensraum zur Verfï¿½gung zu stellen.

Das hier diskutierte Problem der Mehrdeutigkeit umgeht man in vielen anderen Programmiersprachen durch die Definition von Schlï¿½sselwï¿½rtern, die dann fï¿½r frei wï¿½hlbare Bezeichner nicht mehr zur Verfï¿½gung stehen. Ein XML-Autor ist jedoch frei in seiner Wahl der Element- und Attributnamen, also muss auch die Sprache XPath damit umgehen kï¿½nnen. Die gefundene Regelung ermï¿½glicht eine kompakte Schreibweise fï¿½r XPath-Ausdrï¿½cke und bï¿½rdet die Last der eindeutigen Interpretation der jeweiligen XPath-Implementation auf.

Die folgenden Beispiele zeigen, wie Bezeichner (und der *-Operator) abhï¿½ngig vom Kontext unterschiedlich interpretiert werden mï¿½ssen:

```
***
```
bestimmt jeweils den in eine Zahl konvertierten Zeichenkettenwert der ersten Knoten in den durch * reprï¿½sentierten Knotenmengen aller Kindelemente und multipliziert diese miteinander, d.h. das erste und dritte * werden als Lokalisierungspfad, das mittlere * als Multiplikationsoperator interpretiert.
```
and or mod
```
ergibt den Wert wahr, wenn der Kontextknoten wenigstens ein Kindelement namens and oder ein Kindelement namens mod besitzt (Operatorname versus Elementname).
```
text and text()
```
ergibt den Wert wahr, wenn der Kontextknoten sowohl wenigstens ein Element namens text als auch wenigstens einen Textknoten als Kinder besitzt (Knotentyp versus Elementname).
```
position() = position
```
ergibt den Wert wahr, wenn die aktuelle Kontextposition mit dem in eine Zahl konvertierten Zeichenkettenwert eines Kindelements namens position ï¿½bereinstimmt (Funktionsname versus Elementname).
```
parent or parent::child
```
ergibt den Wert wahr, wenn der Kontextknoten ein Kindelement namens parent oder ein Elternelement namens child besitzt (Achsenname versus Elementname).

Lexikalische Struktur von Ausdrï¿½cken

[28]ï¿½ï¿½ï¿½	ExprToken	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	'(' \| ')' \| '[' \| ']' \| '.' \| '..' \| '@' \| ',' \| '::'
			\| NameTest
			\| NodeType
			\| Operator
			\| FunctionName
			\| AxisName
			\| Literal
			\| Number
			\| VariableReference
[29]ï¿½ï¿½ï¿½	Literal	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	'"' [^"]* '"'
			\| "'" [^']* "'"
[30]ï¿½ï¿½ï¿½	Number	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	Digits ('.' Digits?)?
			\| '.' Digits
[31]ï¿½ï¿½ï¿½	Digits	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	[0-9]+
[32]ï¿½ï¿½ï¿½	Operator	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	OperatorName
			\| MultiplyOperator
			\| '/' \| '//' \| '\|' \| '+' \| '-' \| '=' \| '!=' \| '<' \| '<=' \| '>' \| '>='
[33]ï¿½ï¿½ï¿½	OperatorName	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	'and' \| 'or' \| 'mod' \| 'div'
[34]ï¿½ï¿½ï¿½	MultiplyOperator	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	'*'
[35]ï¿½ï¿½ï¿½	FunctionName	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	QName - NodeType
[36]ï¿½ï¿½ï¿½	VariableReference	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	'$' QName
[37]ï¿½ï¿½ï¿½	NameTest	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	'*'
			\| NCName ':' '*'
			\| QName
[38]ï¿½ï¿½ï¿½	NodeType	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	'comment'
			\| 'text'
			\| 'processing-instruction'
			\| 'node'
[39]ï¿½ï¿½ï¿½	ExprWhitespace	ï¿½ï¿½ï¿½::=ï¿½ï¿½ï¿½	S

4 Bibliothek der Grundfunktionen

Dieser Abschnitt beschreibt die Funktionen, die bei einer XPath-Implementation immer in der bei der Auswertung von Ausdrï¿½cken benutzten Funktionsbibliothek enthalten sein mï¿½ssen.

Jede Funktion in der Funktionsbibliothek wird ï¿½ber einen Funktionsprototypen spezifiziert, der den Rï¿½ckgabetyp, den Namen der Funktion und die Typen der Argumente angibt. Falls ein Argument von einem Fragezeichen gefolgt wird, so ist es optional; andernfalls ist es obligatorisch.

Anmerkung des ï¿½bersetzers:

Ein Funktionsargument, dem ein Stern * folgt, darf keinmal, einmal oder mehrmals auftreten. Der Argumenttyp object steht fï¿½r einen beliebigen Typ.

4.1 Funktionen auf Knotenmengen

Funktion: number last()

Die Funktion last liefert eine Zahl, die gleich der Kontextgrï¿½ï¿½e des Kontexts des ausgewerteten Ausdrucks ist.

Funktion: number position()

Die Funktion position liefert eine Zahl, die gleich der Kontextposition im Kontext des ausgewerteten Ausdrucks ist.

Funktion: number count(node-set)

Die Funktion count liefert die Anzahl der Knoten der ï¿½bergebenen Knotenmenge.

Anmerkung des ï¿½bersetzers:

Fï¿½r den letzten Knoten einer Knotenmenge gilt damit die Gleichheit position()=last(). Beachten Sie, dass die Nummerierung der Knoten bei 1 beginnt.

Wï¿½hrend last also die Kontextgrï¿½ï¿½e zurï¿½ckgibt, d.h. die Anzahl der Knoten der Knotenmenge, in der sich der Kontextknoten befindet, berechnet count die Anzahl der Knoten einer beliebigen als Argument zu ï¿½bergebenden Knotenmenge. Es gibt keinen XPath-Ausdruck, der fï¿½r einen beliebigen Knoten dessen Position in einer vorgegebenen Knotenmenge berechnet.

In bestimmten Situationen lï¿½sst sich jedoch das Wissen ï¿½ber die Art der Beziehungen der Knoten in der Knotenmenge ausnutzen. Mï¿½chte man beispielsweise herausfinden, welche Position das erste para-Kind mit dem Attribut type="warning" unter allen para-Kindern besitzt, kann man einfach die diesem Element vorangehenden para-Geschwister zï¿½hlen und 1 addieren:

count(para[@type="warning"]/preceding-sibling::para)+1

Diese Methode funktioniert hier deshalb, weil klar ist, dass alle para-Elemente Geschwister sind und auf die vorherigen Knoten der Menge daher ï¿½ber die Achse preceding-sibling zugegriffen werden kann. Wenn nicht bekannt ist, wie die Knotenmenge gebildet wurde, kï¿½nnen die anderen Knoten auch nicht bestimmt und gezï¿½hlt werden.

In Kapitel [3.3 Knotenmengen] wird im Zusammenhang mit dem Mengenvereinigungsoperator | gezeigt, wie die Funktion count zur Bestimmung von Durchschnitt und Differenz zweier Mengen genutzt werden kann.

Funktion: node-set id(object)

Die Funktion id wï¿½hlt Elemente anhand ihrer eindeutigen ID aus (siehe [5.2.1 Eindeutige IDs]). Wenn als Argument eine Knotenmenge ï¿½bergeben wird, so ergibt sich das Ergebnis aus der Vereinigung der Knotenmengen, die durch den Aufruf von id mit dem Zeichenkettenwert jedes Knotens aus der ï¿½bergebenen Knotenmenge berechnet werden. Ist das Argument der Funktion id von einem beliebigen anderen Typ, so wird es wie bei einem Aufruf der Funktion string in eine Zeichenkette konvertiert; die Zeichenkette wird in eine durch Leerraumzeichen getrennte Liste von Tokens aufgeteilt (Leerraumzeichen sind beliebige Folgen von Zeichen, die sich aus der Produktion S ableiten lassen). Das Ergebnis ist eine Knotenmenge, die die Elemente aus dem Dokument des Kontextknotens enthï¿½lt, die eine eindeutige ID mit dem gleichen Wert wie eines der Tokens der Liste besitzen.

id("foo") wï¿½hlt die Elemente mit der eindeutigen ID foo aus.
id("foo")/child::para[position()=5] wï¿½hlt das fï¿½nfte para-Kindelement des Elements mit der eindeutigen ID foo aus.

Anmerkung des ï¿½bersetzers:

Diese Funktion ermï¿½glicht die Auswertung von Attributen des Typs IDREF bzw. IDREFS. Da ein IDREF-Wert als ID an ein Element im gleichen XML-Dokument vergeben worden sein muss, lï¿½sst sich dieses Element mit Hilfe der Funktion id bestimmen. Handelt es sich um mehrere IDs als Wert eines IDREFS-Attributs, liefert id alle zugehï¿½rigen Elemente als Knotenmenge.

Entsprechend der obigen Definition gilt also:

id("foo bar baz") = id("foo") | id("bar") | id("baz")

Die Knoten in der Ergebnisknotenmenge werden durch ein folgendes Prï¿½dikat in Dokumentordnung gefiltert und nicht in der Reihenfolge der angegebenen IDs.

Dagegen wird bei der ï¿½bergabe einer Knotenmenge, wie im Beispiel id(foo), von allen Knoten der Menge deren Zeichenkettenwert als Parameter verarbeitet und dieser wie ein IDREFS-Attribut interpretiert. Das Ergebnis ist die Vereinigung aller auf diese Weise bestimmten Knoten.

Die Funktion id kann aber nur korrekt arbeiten, wenn ID-wertige Attribute als solche erkannt werden. Dazu muss die DTD bekannt und vom Parser ausgewertet worden sein. Dies ist einer der wenigen Fï¿½lle, in denen das Ergebnis eines XPath-Ausdrucks von der Kenntnis der DTD des Dokuments abhï¿½ngt. Fehlt diese Information, liefert id immer eine leere Knotenmenge.

Es gibt keine komplementï¿½re Funktion, die fï¿½r ein Element dessen ID zurï¿½ckliefert. Unter Zuhilfenahme von id lï¿½sst sich diese Information allerdings herausfinden. Gesucht ist nï¿½mlich genau das Attribut, fï¿½r das die Funktion id den Elternknoten dieses Attributs liefert:

@*[id(.) and count(id(.)|..)=1]

Funktion: string local-name(node-set?)

Die Funktion local-name liefert den lokalen Teil des erweiterten Namens des ersten Knotens in der Argumentknotenmenge bezï¿½glich der Dokumentordnung. Falls die ï¿½bergebene Knotenmenge leer ist oder der erste Knoten keinen erweiterten Namen besitzt, wird eine leere Zeichenkette zurï¿½ckgegeben. Wird kein Argument ï¿½bergeben, wird stattdessen eine Knotenmenge mit dem Kontextknoten als einzigem Element benutzt.

Anmerkung des ï¿½bersetzers:

Fï¿½r Element- und Attributknoten gilt damit, dass die Funktion local-name den dem Doppelpunkt folgenden Teil des QName zurï¿½ckgibt bzw. den vollstï¿½ndigen Namen, wenn dieser kein Prï¿½fix enthï¿½lt. Die folgenden Beispiele demonstrieren dies unter der Voraussetzung, dass der als jeweiliges Argument ï¿½bergebene Lokalisierungspfad nicht die leere Knotenmenge ergibt:

local-name(xhtml:body) = "body"
local-name(@xlink:href) = "href"
local-name(para) = "para"

Fï¿½r Namensraumknoten liefert local-name das zugewiesene Prï¿½fix, also beispielsweise fï¿½r die Deklaration xmlns:xlink="http://www.w3.org/1999/xlink" die Zeichenkette ï¿½xlinkï¿½. Fï¿½r Namensraumknoten, die den voreingestellten Namensraum reprï¿½sentieren, wird die leere Zeichenkette zurï¿½ckgegeben.

Fï¿½r Processing Instructions liefert local-name das jeweilige Ziel, also beispielsweise fï¿½r die Zeichenkette ï¿½xml-stylesheetï¿½.

Fï¿½r Textknoten, Kommentare und den Wurzelknoten liefert local-name die leere Zeichenkette.

Funktion: string namespace-uri(node-set?)

Die Funktion namespace-uri liefert den Namensraum-URI des erweiterten Namens des ersten Knotens in der Argumentknotenmenge bezï¿½glich der Dokumentordnung. Falls die ï¿½bergebene Knotenmenge leer ist, der erste Knoten keinen erweiterten Namen besitzt oder der Namensraum-URI des erweiterten Namens leer ist, wird eine leere Zeichenkette zurï¿½ckgegeben. Wird kein Argument ï¿½bergeben, wird stattdessen eine Knotenmenge mit dem Kontextknoten als einzigem Element benutzt.

Anmerkung: Die von der Funktion namespace-uri zurï¿½ckgegebene Zeichenkette ist auï¿½er fï¿½r Element- oder Attributknoten immer leer.

Anmerkung des ï¿½bersetzers:

Beispiele: namespace-uri(xhtml:body) liefert den zum Prï¿½fix xhtml gehï¿½renden Namensraum-URI (z.B. ï¿½http://www.w3.org/1999/xhtmlï¿½), entsprechend ergibt namespace-uri(@xlink:href) die Zeichenkette ï¿½http://www.w3.org/1999/xlinkï¿½, falls das Prï¿½fix xlink an diesen URI gebunden wurde. Fï¿½r Elementknoten aus dem voreingestellten Namensraum liefert namespace-uri den dazugehï¿½rigen URI. Fï¿½r Element- und Attributknoten, die keinem Namensraum angehï¿½ren, wird die leere Zeichenkette zurï¿½ckgegeben.

Funktion: string name(node-set?)

Die Funktion name liefert eine Zeichenkette mit einem QName, die den erweiterten Namen des ersten Knotens in der Argumentknotenmenge bezï¿½glich der Dokumentordnung reprï¿½sentiert. Der QName muss den erweiterten Namen unter Berï¿½cksichtigung der Namensraumdeklarationen reprï¿½sentieren, die fï¿½r den Knoten gï¿½ltig sind, dessen erweiterter Name reprï¿½sentiert wird. Typischerweise ist das der QName, der in der XML-Quelle vorkommt. Das muss nicht der Fall sein, wenn es fï¿½r den Knoten Namensraumdeklarationen gibt, die dem gleichen Namensraum mehrere Prï¿½fixe zuordnen. Allerdings kann eine Implementation Informationen ï¿½ber das Originalprï¿½fix speichern; in diesem Fall kann die Implementation sicherstellen, dass der zurï¿½ckgegebene String immer der in der XML-Quelle benutzte QName ist. Falls die ï¿½bergebene Knotenmenge leer ist oder der erste Knoten keinen erweiterten Namen besitzt, wird eine leere Zeichenkette zurï¿½ckgegeben. Wird kein Argument ï¿½bergeben, wird stattdessen eine Knotenmenge mit dem Kontextknoten als einzigem Element benutzt.

Anmerkung: Die von der Funktion name gelieferte Zeichenkette ist die gleiche wie die von der Funktion local-name gelieferte, auï¿½er fï¿½r Element- und Attributknoten.

Anmerkung des ï¿½bersetzers:

Fï¿½r einen folgendermaï¿½en definierten Elementknoten

darf die Funktion name damit die Zeichenkette ï¿½y:fooï¿½ liefern, da durch das Prï¿½fix y der gleiche Namensraum reprï¿½sentiert wird wie durch x.

Die drei Funktionen local-name, namespace-uri und name werden in der folgenden Tabelle kurz zusammengefasst. Das Zeichen ï¿½-ï¿½ steht dabei fï¿½r die leere Zeichenkette:

	local-name	namespace-uri	name
[5.1 Wurzelknoten]	-	-	-
[5.2 Elementknoten]	Name ohne Prï¿½fix	URI des Namensraums, in dem sich das Element befindet	voller Name
[5.3 Attributknoten]	Name ohne Prï¿½fix	URI des Namensraums, in dem sich das Attribut befindet	voller Name
[5.4 Namensraumknoten]	Namensraum-Prï¿½fix	-	Namensraum-Prï¿½fix
[5.5 Processing-Instruction-Knoten]	Ziel	-	Ziel
[5.6 Kommentarknoten]	-	-	-
[5.7 Textknoten]	-	-	-

Diese Funktionen erwarten als Argument zwar eine Knotenmenge, werten jedoch immer nur den ersten Knoten bezï¿½glich der Dokumentordnung aus. Der zugrunde liegende Begriff erweiterter Name wird in Kapitel [5 Datenmodell] erlï¿½utert.

ï¿½ber den Umweg, den Namen eines Knotens auszuwerten, lassen sich Knotentests variabel beschreiben. Mï¿½chte man beispielsweise den Typ eines Nachkommenelements parametrisieren, kann man nicht descendant::$name verwenden. Mittels der Funktionen local-name und namespace-uri lï¿½sst sich das Problem lï¿½sen, indem zunï¿½chst alle Nachkommenelemente in die Ausgangsknotenmenge aufgenommen und anschlieï¿½end innerhalb eines Prï¿½dikats diejenigen mit dem richtigen Namen und dem richtigen Namensraum herausgefiltert werden:

descendant::*[local-name()=$lname and namespace-uri()=$uri]

Fï¿½r XML-Dokumente, die keinen Gebrauch von Namensrï¿½umen machen, reicht bereits ein Vergleich mit der von der Funktion name gelieferten Zeichenkette.

4.2 Zeichenkettenfunktionen

Funktion: string string(object?)

Die Funktion string konvertiert ein Objekt wie folgt in eine Zeichenkette:

Eine Knotenmenge wird in eine Zeichenkette konvertiert, indem der Zeichenkettenwert des ersten Knotens in Dokumentordnung zurï¿½ckgegeben wird. Falls die Knotenmenge leer ist, wird eine leere Zeichenkette zurï¿½ckgegeben.

Anmerkung des ï¿½bersetzers:

Der Zeichenkettenwert fï¿½r jeden Knotentyp wird in Kapitel [5 Datenmodell] definiert. An dieser Stelle wird bereits zusammengefasst, welchen Wert die Funktion string abhï¿½ngig vom jeweiligen Knotentyp zurï¿½ckgibt.

	string
[5.1 Wurzelknoten]	Zeichenkettenwert des Dokumentelements (des einzigen Kindes des Wurzelknotens)
[5.2 Elementknoten]	Verkettung der Zeichenkettenwerte aller Element- und Text-Kindknoten
[5.3 Attributknoten]	normalisierter Attributwert
[5.4 Namensraumknoten]	URI, d.h. Name des Namensraumes
[5.5 Processing-Instruction-Knoten]	Inhalt, der dem Ziel der Processing Instruction folgt
[5.6 Kommentarknoten]	Kommentarinhalt
[5.7 Textknoten]	enthaltene Zeichendaten

Eine Zahl wird wie folgt in eine Zeichenkette konvertiert:
- NaN (Not a Number â€“ keine gï¿½ltige Zahl) wird in die Zeichenkette NaN konvertiert.
- Positiv Null wird in die Zeichenkette 0 konvertiert.
- Negativ Null wird in die Zeichenkette 0 konvertiert.
- Positiv unendlich wird in die Zeichenkette Infinity konvertiert.
- Negativ unendlich wird in die Zeichenkette -Infinity konvertiert.
- Falls die Zahl ein Integer ist, wird sie in dezimaler Form als Number dargestellt, ohne Dezimalpunkt und fï¿½hrende Nullen, mit negativem Vorzeichen (-), falls die Zahl negativ ist.
- Ansonsten wird die Zahl in Dezimalform als Number dargestellt, einschlieï¿½lich Dezimalpunkt, wenigstens einer Ziffer vor und nach dem Dezimalpunkt sowie einem negativen Vorzeichen (-), falls die Zahl negativ ist. Es dï¿½rfen keine fï¿½hrenden Nullen vor dem Dezimalpunkt auftreten mit Ausnahme der eventuell erforderlichen Ziffer direkt vor dem Dezimalpunkt. Abgesehen von der einen erforderlichen Ziffer nach dem Dezimalpunkt mï¿½ssen dort so viele, aber nicht mehr, Ziffern auftreten, wie zur eindeutigen Unterscheidung von allen anderen IEEE 754 numerischen Werten notwendig sind.
Der boolesche Wert falsch wird in die Zeichenkette false konvertiert. Der boolesche Wert wahr wird in die Zeichenkette true konvertiert.
Die Konvertierung eines Objekts von einem anderen Typ als den vier Grundtypen hï¿½ngt von diesem Typ ab.

Wird kein Argument ï¿½bergeben, wird stattdessen eine Knotenmenge mit dem Kontextknoten als einzigem Element benutzt.

Anmerkung: Die Funktion string ist nicht dafï¿½r gedacht, Zahlen in Zeichenketten zu konvertieren, die an Nutzer ausgegeben werden. Die in [XSLT] definierte Funktion format-number und das ebenfalls dort definierte Element xsl:number stellen diese Funktionalitï¿½t bereit.

Funktion: string concat(string, string, string*)

Die Funktion concat liefert die Verkettung ihrer Argumente.

Funktion: boolean starts-with(string, string)

Die Funktion starts-with liefert den logischen Wert wahr, falls die im ersten Argument ï¿½bergebene Zeichenkette mit der im zweiten Argument ï¿½bergebenen Zeichenkette beginnt, und andernfalls falsch.

Anmerkung des ï¿½bersetzers:

Gemï¿½ï¿½ Errata-Dokument [XPath Errata] muss an dieser Stelle folgender Satz ergï¿½nzt werden:

Wenn das zweite Argument die leere Zeichenkette ist, wird der Wert wahr zurï¿½ckgegeben.

Funktion: boolean contains(string, string)

Die Funktion contains liefert den logischen Wert wahr, falls die im ersten Argument ï¿½bergebene Zeichenkette die im zweiten Argument ï¿½bergebene Zeichenkette enthï¿½lt, und andernfalls falsch.

Anmerkung des ï¿½bersetzers:

Gemï¿½ï¿½ Errata-Dokument [XPath Errata] muss an dieser Stelle folgender Satz ergï¿½nzt werden:

Wenn das zweite Argument die leere Zeichenkette ist, wird der Wert wahr zurï¿½ckgegeben.

Funktion: string substring-before(string, string)

Die Funktion substring-before liefert aus der im ersten Argument ï¿½bergebenen Zeichenkette die Teilzeichenkette, die vor dem ersten Auftreten der im zweiten Argument ï¿½bergebenen Zeichenkette steht, bzw. die leere Zeichenkette, falls die erste Zeichenkette nicht die zweite enthï¿½lt. Zum Beispiel liefert substring-before("1999/04/01","/") das Ergebnis 1999.

Anmerkung des ï¿½bersetzers:

Gemï¿½ï¿½ Errata-Dokument [XPath Errata] muss an dieser Stelle folgender Satz ergï¿½nzt werden:

Wenn das zweite Argument die leere Zeichenkette ist, wird die leere Zeichenkette zurï¿½ckgegeben.

Funktion: string substring-after(string, string)

Die Funktion substring-after liefert aus der im ersten Argument ï¿½bergebenen Zeichenkette die Teilzeichenkette, die nach dem ersten Auftreten der im zweiten Argument ï¿½bergebenen Zeichenkette steht, bzw. die leere Zeichenkette, falls die erste Zeichenkette nicht die zweite enthï¿½lt. Zum Beispiel liefert substring-after("1999/04/01","/") das Ergebnis 04/01 und substring-after("1999/04/01","19") liefert 99/04/01.

Anmerkung des ï¿½bersetzers:

Gemï¿½ï¿½ Errata-Dokument [XPath Errata] muss an dieser Stelle folgender Satz ergï¿½nzt werden:

Wenn das zweite Argument die leere Zeichenkette ist, wird die im ersten Argument ï¿½bergebene Zeichenkette zurï¿½ckgegeben.

Funktion: string substring(string, number, number?)

Die Funktion substring liefert aus der im ersten Argument ï¿½bergebenen Zeichenkette die Teilzeichenkette, die an der im zweiten Argument angegebenen Position beginnt und die im dritten Argument angegebene Lï¿½nge besitzt. Zum Beispiel liefert substring("12345",2,3) das Ergebnis "234". Falls kein drittes Argument angegeben wird, liefert die Funktion die Teilzeichenkette, die an der im zweiten Argument angegebenen Position beginnt und bis zum Ende der Zeichenkette reicht. Zum Beispiel liefert substring("12345",2) das Ergebnis "2345".

Genauer gesagt wird fï¿½r jedes Zeichen der Zeichenkette (siehe [3.6 Zeichenketten]) eine numerische Position angenommen: die Position des ersten Zeichens ist 1, die Position des zweiten Zeichens ist 2 usw.

Anmerkung: Dies unterscheidet sich von Java und ECMAScript, in denen die Methode String.substring die Position des ersten Zeichens mit 0 definiert.

Die zurï¿½ckgegebene Teilzeichenkette enthï¿½lt die Zeichen, deren Position grï¿½ï¿½er oder gleich dem gerundeten Wert des zweiten Arguments ist und, falls ein drittes Argument ï¿½bergeben wurde, kleiner als die Summe des gerundeten Wertes des zweiten und des gerundeten Wertes des dritten Arguments. Vergleich und Addition folgen den Standardregeln von IEEE 754; die Rundung erfolgt wie durch die Funktion round. Die folgenden Beispiele illustrieren einige unï¿½bliche Fï¿½lle:

substring("12345", 1.5, 2.6) liefert "234"
substring("12345", 0, 3) liefert "12"
substring("12345", 0 div 0, 3) liefert ""
substring("12345", 1, 0 div 0) liefert ""
substring("12345", -42, 1 div 0) liefert "12345"
substring("12345", -1 div 0, 1 div 0) liefert ""

Anmerkung des ï¿½bersetzers:

Die letzten vier Beispiele werden plausibel, wenn man die Definition fï¿½r substring wortgetreu anwendet und beachtet, dass ein Vergleich mit dem Wert NaN immer falsch sowie jede Gleitkommazahl kleiner als positiv unendlich ist.

Mit Hilfe eines ï¿½hnlich gearteten Aufrufs dieser Funktion kï¿½nnen bedingte Ausdrï¿½cke fï¿½r Zeichenketten und damit auch Zahlen simuliert werden. Ein bedingter Ausdruck liefert abhï¿½ngig von der Auswertung eines logischen Ausdrucks einen von zwei mï¿½glichen vorgegebenen Werten. Fï¿½r Knotenmengen wurde die analoge Funktionalitï¿½t im Zusammenhang mit dem Vereinigungsoperator | bereits in Kapitel [3.3 Knotenmengen] vorgestellt.

Unter Ausnutzung der Tatsache, dass ein logischer Wert wahr nach 1 und ein logischer Wert falsch nach 0 konvertiert wird (siehe Regeln bei der Funktion number), ergibt der Ausdruck

substring(string, 1 div boolean-test)

den Wert string, falls boolean-test wahr ist, und ansonsten die leere Zeichenkette. Die vollstï¿½ndige Formulierung eines bedingten Ausdrucks sieht damit folgendermaï¿½en aus:

concat(substring(true-string, 1 div boolean-test),
       substring(false-string, 1 div not(boolean-test)))

Solche Ausdrï¿½cke kï¿½nnen beim Sortieren in XSLT eingesetzt werden, wenn der zu benutzende Sortierschlï¿½ssel von einer aktuell auszuwertenden Bedingung abhï¿½ngt. Allerdings werden sie bei komplexeren Bedingungen schnell unï¿½bersichtlich.

Funktion: number string-length(string?)

Die Funktion string-length liefert die Anzahl der Zeichen der Zeichenkette (siehe [3.6 Zeichenketten]). Falls kein Argument ï¿½bergeben wurde, wird der in eine Zeichenkette konvertierte Kontextknoten angenommen, mit anderen Worten der Zeichenkettenwert des Kontextknotens.

Anmerkung des ï¿½bersetzers:

Es gibt in XPath keine Funktion ends-with, die analog zu starts-with bestimmt, ob eine Zeichenkette mit einer anderen endet. Mit Hilfe der Funktionen substring und string-length kann diese Funktionalitï¿½t jedoch nachgebildet werden. ends-with($str1, $str2) wï¿½rde den Wert wahr liefern, falls gilt:

$str2 = substring($str1, string-length($str1) - string-length($str2) + 1)

Fï¿½r das Auffï¿½llen einer Zeichenkette von links mit Leerzeichen (z.B. fï¿½r eine rechtsbï¿½ndige Textausgabe) erweisen sich die Funktionen concat, substring und string-length sowie eine ausreichend lange, ausschlieï¿½lich aus Leerzeichen bestehende Zeichenkette als gute Helfer:

concat(substring("                                             ",
                 1, $width - string-length($eingabe)), $eingabe)

Funktion: string normalize-space(string?)

Die Funktion normalize-space liefert als Ergebnis die ï¿½bergebene Zeichenkette mit normalisiertem Leerraum zurï¿½ck, d.h. fï¿½hrender und abschlieï¿½ender Leerraum werden entfernt, Folgen von mehreren Leerraumzeichen werden durch ein einzelnes Leerzeichen ersetzt. Leerraumzeichen sind jene, die durch die Produktion S in XML definiert sind. Falls kein Argument ï¿½bergeben wurde, wird der in eine Zeichenkette konvertierte Kontextknoten angenommen, mit anderen Worten der Zeichenkettenwert des Kontextknotens.

Anmerkung des ï¿½bersetzers:

Diese Funktion verarbeitet eine ï¿½bergebene Zeichenkette in der gleichen Weise, wie ein XML-Prozessor nach Ersetzung aller Referenzen Nicht-CDATA-Attribute behandelt, siehe Kapitel 3.3.3 in [XML, 2nd Edition].

Zur Erlï¿½uterung sei das folgende Beispiel angegeben. Hï¿½ufig finden sich in XML-Dokumenten Textdaten, die folgendermaï¿½en ausgezeichnet sind:


   Otto Normal

Der Zeichenkettenwert des Elements name enthï¿½lt neben der wichtigen Information ï¿½ber Otto Normal auch alle Leerraumzeichen, also den Zeilenumbruch nach dem Start-Tag , die Leerzeichen vor Otto und den Zeilenumbruch inklusive eventueller Leerzeichen vor dem schlieï¿½enden End-Tag. Ein Vergleich fï¿½r den Kontextknoten name

.="Otto Normal"

liefert also nicht das erhoffte Ergebnis, sondern schlï¿½gt fehl. Korrekt ist in diesem Fall stattdessen ein Vergleich mit dem normalisierten Wert des Knotens:

normalize-space()="Otto Normal"

Am Beispiel normalize-space soll an dieser Stelle vor einer Falle gewarnt werden, in die man bei der ï¿½bergabe von Knotenmengen an Funktionen mit skalaren Parametertypen leicht geraten kann. Angenommen, der Name Otto Normal kommt mehrfach vor und man mï¿½chte nur den ersten dieser name-Knoten bearbeiten. In diesem Fall kann man z.B. verlangen, dass keiner der Vorgï¿½nger den gleichen Namen hat. Ist eine Normalisierung nicht erforderlich, lautet der Test einfach:

.="Otto Normal" and not(preceding-sibling::name="Otto Normal")

Muss man aber normalisieren, erweist sich der folgende Test als ungeeignet:

normalize-space()="Otto Normal" and
not(normalize-space(preceding-sibling::name)="Otto Normal")

Da die Funktion normalize-space als Argument eine Zeichenkette erwartet, wird die ï¿½bergebene Knotenmenge mit der Funktion string konvertiert. Es wird also letztlich nur der erste Knoten (bezï¿½glich der Dokumentordnung) der ï¿½bergebenen Knotenmenge durch normalize-space ausgewertet und damit nur getestet, ob der erste name-Knoten einen von ï¿½Otto Normalï¿½ verschiedenen normalisierten Zeichenkettenwert besitzt. Die Lï¿½sung besteht in solchen Fï¿½llen darin, den Test in ein Prï¿½dikat zu verschieben:

normalize-space()="Otto Normal" and
not(preceding-sibling::name[normalize-space()="Otto Normal"])

Funktion: string translate(string, string, string)

Die Funktion translate liefert als Ergebnis die im ersten Argument ï¿½bergebene Zeichenkette, wobei jedes Vorkommen eines Zeichens aus der im zweiten Argument ï¿½bergebenen Zeichenkette ersetzt wird durch das Zeichen an der korrespondierenden Position aus der im dritten Argument ï¿½bergebenen Zeichenkette. Zum Beispiel liefert translate("bar","abc","ABC") die Zeichenkette BAr. Wenn es im zweiten Argument ein Zeichen gibt, fï¿½r das kein korrespondierendes Zeichen im dritten Argument existiert (weil das zweite Argument lï¿½nger ist als das dritte), so werden alle Vorkommen dieses Zeichens im ersten Argument entfernt. Zum Beispiel liefert translate("--aaa--","abc-","ABC") das Ergebnis "AAA". Falls ein Zeichen mehrmals im zweiten Argument vorkommt, bestimmt das erste Auftreten das Ersetzungszeichen. Falls die im dritten Argument ï¿½bergebene Zeichenkette lï¿½nger ist als die zweite, werden ï¿½berzï¿½hlige Zeichen ignoriert.

Anmerkung: Die Funktion translate ist keine ausreichende Lï¿½sung fï¿½r die Umwandlung zwischen Groï¿½- und Kleinschreibung in allen Sprachen. Eine zukï¿½nftige Version von XPath kann zusï¿½tzliche Funktionen fï¿½r diese Umwandlung zur Verfï¿½gung stellen.

Anmerkung des ï¿½bersetzers:

Fï¿½r deutsche Umlaute reicht sie im Allgemeinen aus. Mï¿½chte man in einem Stylesheet an mehreren Stellen Klein- in Groï¿½schreibung umwandeln, bietet es sich an, geeignete Variablen zu definieren und fortan diese zu benutzen.

In XSLT sï¿½he das folgendermaï¿½en aus:




...

   ...

Allerdings stï¿½ï¿½t man schon beim Buchstaben ï¿½ß« an die Grenzen der Funktion translate. Die Ersetzung von ï¿½ß« durch die beiden Buchstaben ï¿½SSï¿½ ist auf diese Weise nicht mï¿½glich, weil der Ersetzungstext lï¿½nger als ein Zeichen ist.

Allgemein gilt, dass die Funktion translate kein Mittel zum Ersetzen von beliebigen Teilzeichenketten ist. Ein einmaliges Ersetzen im Sinne von replace($string, $from, $to) kann durch

concat(substring-before($string, $from), $to,
       substring-after($string, $from))

ausgedrï¿½ckt werden. XPath 1.0 stellt keine Mittel bereit, alle Vorkommen von $from in $string durch $to zu ersetzen. Dies wird sich in einer zukï¿½nftigen XPath-Version ï¿½ndern [XPath Operators 2.0].

Mit der Funktion translate lassen sich darï¿½ber hinaus sehr einfach ausgewï¿½hlte Zeichen aus einer Zeichenkette entfernen, indem als drittes Argument eine leere Zeichenkette ï¿½bergeben wird. Dies kann beispielsweise fï¿½r den Test genutzt werden, ob eine Zeichenkette $string nur die in $allowed-char aufgezï¿½hlten Zeichen enthï¿½lt:

translate($string, $allowed-char, "") = ""

4.3 Boolesche Funktionen

Funktion: boolean boolean(object)

Die Funktion boolean konvertiert ihr Argument wie folgt in einen Boolean-Wert:

Eine Zahl ergibt den Wert wahr genau dann, wenn sie weder positiv oder negativ Null noch NaN ist.

Eine Knotenmenge ergibt den Wert wahr genau dann, wenn sie nicht leer ist.

Anmerkung des ï¿½bersetzers:

Aus diesem Grund lï¿½sst sich ein Test auf das Vorhandensein von Knoten sehr kompakt aufschreiben: img[@alt] bedeutet dasselbe wie img[boolean(@alt)]. Gesucht ist damit ein img-Element, das ein alt-Attribut besitzt.

Eine Zeichenkette ergibt genau dann den Wert wahr, wenn ihre Lï¿½nge ungleich Null ist.

Anmerkung des ï¿½bersetzers:

Zum Vergleich mit dem letzten Beispiel: img[string(@alt)] steht abkï¿½rzend fï¿½r img[boolean(string(@alt))] und bedeutet jetzt, dass ein img-Element gesucht wird, dessen alt-Attribut einen nichtleeren Zeichenkettenwert besitzt. Fï¿½r wï¿½re der erste Test erfï¿½llt, der zweite jedoch nicht.

Die Konvertierung eines Objekts von einem anderen Typ als den vier Grundtypen hï¿½ngt von diesem Typ ab.

Anmerkung des ï¿½bersetzers:

Wï¿½hrend das Argument der Funktionen string und number optional ist, beim Fehlen damit der Kontextknoten angenommen wird, ist das Argument fï¿½r die Funktion boolean obligatorisch. Eine analoge Definition, die gegebenenfalls auf den Kontextknoten zurï¿½ckgreift, hï¿½tte auch nicht viel Sinn, da in diesem Fall die Funktion boolean den Wert wahr liefern mï¿½sste â€“ der Kontextknoten ist schlieï¿½lich immer vorhanden.

Funktion: boolean not(boolean)

Die Funktion not liefert den Wert wahr, wenn ihr Argument falsch ist, und ansonsten falsch.

Anmerkung des ï¿½bersetzers:

Im Unterschied zu den Operatoren and und or, die in den Produktionen OrExpr bzw. AndExpr definiert werden, handelt es sich bei not um eine Funktion.

Funktion: boolean true()

Die Funktion true liefert den Wert wahr.

Funktion: boolean false()

Die Funktion false liefert den Wert falsch.

Anmerkung des ï¿½bersetzers:

XPath definiert keine Literale fï¿½r wahr und falsch. Soll ein boolescher Wert als Parameter an eine Funktion oder ein benanntes XSLT-Template ï¿½bergeben werden, muss dafï¿½r eine der Funktionen true oder false benutzt werden.

Funktion: boolean lang(string)

Die Funktion lang liefert einen Wert wahr oder falsch in Abhï¿½ngigkeit davon, ob die durch xml:lang-Attribute angegebene Sprache des Kontextknotens die gleiche oder eine Untersprache der im Argument ï¿½bergebenen Zeichenkette ist. Die Sprache des Kontextknotens wird durch den Wert des Attributes xml:lang des Kontextknotens bestimmt oder, wenn der Kontextknoten kein Attribut xml:lang besitzt, durch den Wert des Attributes xml:lang beim nï¿½chsten Vorfahren des Kontextknotens, der ein Attribut xml:lang besitzt. Wenn es kein solches Attribut gibt, liefert lang den Wert falsch. Wenn es ein solches Attribut gibt, liefert lang den Wert wahr, wenn der Attributwert gleich dem Argument ist, unabhï¿½ngig von der Groï¿½- oder Kleinschreibung, oder wenn es ein mit - beginnendes Suffix derart gibt, dass der Attributwert gleich dem Argument ohne dieses Suffix ist, unabhï¿½ngig von der Groï¿½- oder Kleinschreibung. Beispielsweise wï¿½rde lang("en") den Wert wahr liefern, wenn es sich beim Kontextknoten um eines dieser fï¿½nf Elemente handelt:

Anmerkung des ï¿½bersetzers:

Handelt es sich beim Kontextknoten dagegen um das para-Element im Beispiel

liefert lang("en") den Wert falsch. Der nï¿½chste Vorfahre mit einem xml:lang-Attribut ist in diesem Fall das Element sect, in welchem die Sprache auf de gesetzt wird.

Das Verhalten der Funktion lang darf nicht mit einem impliziten Vorhandensein des Attributs xml:lang verwechselt werden. Fï¿½r das obige Beispiel liefert //para[@xml:lang='de'] eine leere Knotenmenge, wï¿½hrend //para[lang('de')] das para-Element auswï¿½hlt.

4.4 Zahlenfunktionen

Funktion: number number(object?)

Die Funktion number konvertiert ihr Argument wie folgt in eine Zahl:

Eine Zeichenkette, die aus optionalem Leerraum besteht, gefolgt von einem optionalen Minuszeichen, gefolgt von einer Number, gefolgt von Leerraum, wird in eine IEEE-754-Zahl konvertiert, die (entsprechend den Rundungsregeln in IEEE 754) dem mathematischen Wert am nï¿½chsten ist, der durch die Zeichenkette reprï¿½sentiert wird. Jede andere Zeichenkette wird in NaN konvertiert.
Der boolesche Wert wahr wird in 1 konvertiert; der boolesche Wert falsch wird in 0 konvertiert.
Eine Knotenmenge wird zunï¿½chst wie beim Aufruf der Funktion string in eine Zeichenkette konvertiert und anschlieï¿½end in der gleichen Weise wie eine Zeichenkette konvertiert.
Die Konvertierung eines Objekts von einem anderen Typ als den vier Grundtypen hï¿½ngt von diesem Typ ab.

Wird kein Argument ï¿½bergeben, wird stattdessen eine Knotenmenge mit dem Kontextknoten als einzigem Element benutzt.

Anmerkung: Die Funktion number sollte nicht fï¿½r die Konvertierung numerischer Daten in einem Element eines XML-Dokuments benutzt werden, es sei denn, das Element ist von einem Typ, der numerische Daten in einem sprachunabhï¿½ngigen Format reprï¿½sentiert (das typischerweise fï¿½r die Prï¿½sentation fï¿½r einen Anwender in ein sprachspezifisches Format umgewandelt wï¿½rde). Darï¿½ber hinaus kann die Funktion number nur genutzt werden, wenn das von dem Element genutzte sprachunabhï¿½ngige Format mit der XPath-Syntax fï¿½r Number konsistent ist.

Anmerkung des ï¿½bersetzers:

Insbesondere eignet sich eine Zahl im hiesigen Format (der Punkt zur Kennzeichnung der Tausenderstellen, das Komma zur Abgrenzung von den Dezimalstellen) nicht als Argument fï¿½r die Funktion number. Der Aufruf von number('12.000,50') liefert beispielsweise den Wert NaN. Eine Umwandlung in das Format fï¿½r Number kann in diesem Fall mit Hilfe der Funktion translate vorgenommen werden: number(translate('12.000,50', ',.', '.')).

Funktion: number sum(node-set)

Die Funktion sum liefert die Summe aller in eine Zahl konvertierten Zeichenkettenwerte der Knoten aus der Argumentknotenmenge.

Anmerkung des ï¿½bersetzers:

Sie eignet sich damit nur fï¿½r Fï¿½lle, in denen die zu summierenden Werte direkt in der XML-Quelle vorliegen. Sollen die Summanden komplexer sein, d.h. jeweils durch einen eigenen Ausdruck berechnet werden, kann die Funktion sum nicht mehr benutzt werden. XPath nutzende Implementationen kï¿½nnen aber eigene Sprachmittel bereitstellen, mit denen solche Berechnungen durchgefï¿½hrt werden kï¿½nnen.

Die Funktion sum hilft noch in einem anderen Anwendungsfall: Aus der Definition des Verhaltens von number geht hervor, dass letztere eine leere Knotenmenge in den Wert NaN konvertiert. Ein Ausdruck foo - bar liefert damit NaN, falls wenigstens eines der Elemente foo oder bar nicht existiert. Mï¿½chte man stattdessen, dass in diesem Fall die Zahl 0 fï¿½r nicht existierende Elemente angenommen wird, kann man dies ï¿½ber den Ausdruck sum(foo[1]) - sum(bar[1]) erreichen.

Funktion: number floor(number)

Die Funktion floor liefert die grï¿½ï¿½te Zahl (die am nï¿½chsten an positiv unendlich liegt), die nicht grï¿½ï¿½er als das Argument und ganzzahlig ist.

Anmerkung des ï¿½bersetzers:

Gemï¿½ï¿½ Errata-Dokument [XPath Errata] muss an dieser Stelle folgender Absatz ergï¿½nzt werden:

Wenn das Argument NaN ist, wird NaN zurï¿½ckgegeben. Wenn das Argument positiv unendlich ist, wird positiv unendlich zurï¿½ckgegeben. Wenn das Argument negativ unendlich ist, wird negativ unendlich zurï¿½ckgegeben. Wenn das Argument positiv Null ist, wird positiv Null zurï¿½ckgegeben. Wenn das Argument negativ Null ist, wird negativ Null zurï¿½ckgegeben. Wenn das Argument grï¿½ï¿½er als Null, aber kleiner als 1 ist, wird positiv Null zurï¿½ckgegeben.

Funktion: number ceiling(number)

Die Funktion ceiling liefert die kleinste Zahl (die am nï¿½chsten an negativ unendlich liegt), die nicht kleiner als das Argument und ganzzahlig ist.

Anmerkung des ï¿½bersetzers:

Gemï¿½ï¿½ Errata-Dokument [XPath Errata] muss an dieser Stelle folgender Absatz ergï¿½nzt werden:

Wenn das Argument NaN ist, wird NaN zurï¿½ckgegeben. Wenn das Argument positiv unendlich ist, wird positiv unendlich zurï¿½ckgegeben. Wenn das Argument negativ unendlich ist, wird negativ unendlich zurï¿½ckgegeben. Wenn das Argument positiv Null ist, wird positiv Null zurï¿½ckgegeben. Wenn das Argument negativ Null ist, wird negativ Null zurï¿½ckgegeben. Wenn das Argument kleiner als Null, aber grï¿½ï¿½er als -1 ist, wird positiv Null zurï¿½ckgegeben.

Funktion: number round(number)

Die Funktion round liefert die Zahl, die am nï¿½chsten am Argument liegt und die ganzzahlig ist. Wenn es zwei solche Zahlen gibt, wird die Zahl geliefert, die nï¿½her an positiv unendlich liegt. Ist das Argument NaN, wird NaN zurï¿½ckgegeben. Ist das Argument positiv unendlich, wird positiv unendlich zurï¿½ckgegeben. Ist das Argument negativ unendlich, wird negativ unendlich zurï¿½ckgegeben. Ist das Argument positiv Null, wird positiv Null zurï¿½ckgegeben. Ist das Argument negativ Null, wird negativ Null zurï¿½ckgegeben. Ist das Argument kleiner als Null, aber grï¿½ï¿½er oder gleich -0.5, wird negativ Null zurï¿½ckgegeben.

Anmerkung: In den letzten beiden Fï¿½llen ist das Ergebnis des Aufrufs der Funktion round verschieden von der Addition von 0.5 und dem Aufruf der Funktion floor.

Anmerkung des ï¿½bersetzers:

Davon kann man sich leicht selbst ï¿½berzeugen:

Fï¿½r -0 ergibt sich: floor(-0 + 0.5) = floor(0.5) = 0 (positiv Null)

Fï¿½r -0.5 ergibt sich: floor(-0.5 + 0.5) = floor(0) = 0 (positiv Null)

5 Datenmodell

XPath operiert auf der Baumreprï¿½sentation eines XML-Dokuments. Das folgende Kapitel beschreibt, wie XPath ein XML-Dokument als Baum modelliert. Dieses Modell ist rein konzeptionell und schreibt keinerlei spezielle Implementation vor. Die Beziehung zwischen diesem Modell und der XML-Informationsmenge [XML Infoset] wird in [B Abbildung auf die XML-Informationsmenge] beschrieben.

Die durch XPath verarbeiteten XML-Dokumente mï¿½ssen sich nach der XML-Namensraum-Empfehlung [XML Names] richten.

Anmerkung des ï¿½bersetzers:

Insbesondere dï¿½rfen Namen von Elementen und Attributen das Zeichen ï¿½:ï¿½ nur als Separator zwischen Namensraum-Prï¿½fix und lokalem Namen enthalten. Auï¿½erdem muss jedes benutzte Prï¿½fix deklariert worden sein. XML-Dokumente, die den Doppelpunkt nicht Namensraum-konform verwenden, kï¿½nnen durch XPath-Implementationen nicht verarbeitet werden.

Der Baum enthï¿½lt Knoten. Es gibt sieben Typen von Knoten:

Wurzelknoten
Elementknoten
Textknoten
Attributknoten
Namensraumknoten
Processing-Instruction-Knoten
Kommentarknoten

Fï¿½r jeden Knotentyp gibt es einen Weg, den Zeichenkettenwert eines Knotens dieses Typs zu bestimmen. Bei einigen Knotentypen ist der Zeichenkettenwert Teil des Knotens, bei anderen Knotentypen wird der Zeichenkettenwert aus den Zeichenkettenwerten der Nachkommen berechnet.

Anmerkung: Fï¿½r Element- und Wurzelknoten ist der Zeichenkettenwert eines Knotens verschieden von der Zeichenkette, die von der DOM-Methode nodeValue zurï¿½ckgegeben wird (siehe [DOM]).

Einige Knotentypen besitzen auï¿½erdem einen erweiterten Namen â€“ ein Paar bestehend aus einem lokalen Teil und einem Namensraum-URI. Der lokale Teil ist eine Zeichenkette. Der Namensraum-URI ist entweder leer oder eine Zeichenkette. Der im XML-Dokument spezifizierte Namensraum-URI kann eine URI-Referenz sein, wie sie in [RFC2396] definiert ist; das bedeutet, sie kann einen Fragment-Bezeichner besitzen und sie kann relativ sein. Ein relativer URI sollte als absoluter URI wï¿½hrend der Namensraum-Verarbeitung aufgelï¿½st werden: Die Namensraum-URIs der erweiterten Namen von Knoten im Datenmodell sollten absolut sein. Zwei erweiterte Namen sind gleich, wenn sie den gleichen lokalen Teil haben und wenn beide einen leeren Namensraum-URI oder beide die gleichen, nichtleeren Namensraum-URIs besitzen.

Anmerkung des ï¿½bersetzers:

Nach einer Entscheidung des W3C-XML-Plenums ist die Behandlung relativer Namensraum-URIs implementationsabhï¿½ngig. Gemï¿½ï¿½ Errata-Dokument [XPath Errata] mï¿½ssen deshalb aus dem obigen Abschnitt die Sï¿½tze "Der im XML-Dokument spezifizierte Namensraum-URI kann eine URI-Referenz sein, wie sie in [RFC2396] definiert ist; das bedeutet, sie kann einen Fragment-Bezeichner besitzen und sie kann relativ sein. Ein relativer URI sollte als absoluter URI wï¿½hrend der Namensraum-Verarbeitung aufgelï¿½st werden: Die Namensraum-URIs der erweiterten Namen von Knoten im Datenmodell sollten absolut sein." ersetzt werden durch:

Ein in einer Namensraumdeklaration spezifizierter Namensraum-Name in einem XML-Dokument ist eine URI-Referenz, wie sie in [RFC2396] definiert ist; das bedeutet, sie kann einen Fragment-Bezeichner besitzen und sie kann relativ sein. Die Namensraum-URI-Komponente eines erweiterten Namens ist implementationsabhï¿½ngig, wenn der erweiterte Name aus einem QName expandiert wird, dessen Prï¿½fix durch eine Namensraumdeklaration mit einem relativen URI (mit oder ohne Fragment-Bezeichner) als Namensraum-Namen deklariert wurde. Ein XPath-Ausdruck, der vom Wert der Namensraum-URI-Komponente eines solchen erweiterten Namens abhï¿½ngt, ist nicht interoperabel.

Relative URIs der Form ï¿½host.example.org/namespaceï¿½ (fehlendes Schema), ï¿½home/schemaï¿½ (fehlende Host-Angabe), ï¿½http://www.w3.org/1999/../2001/XMLSchemaï¿½ (mit speziellen Pfadkomponenten) oder ï¿½http://www.schema.org/address#oneï¿½ (mit Fragment-Bezeichner) sollten damit vermieden werden.

Es existiert eine Ordnung, die Dokumentordnung, die fï¿½r alle Knoten im Dokument definiert ist und die zu der Ordnung korrespondiert, in der die ersten Zeichen der XML-Reprï¿½sentation aller Knoten in der XML-Reprï¿½sentation des Dokuments nach der Expandierung allgemeiner Entities stehen. Der Wurzelknoten ist demzufolge der erste Knoten. Elementknoten stehen vor ihren Kindern. Das bedeutet, die Dokumentordnung ordnet Elementknoten in der Reihenfolge ihrer Start-Tags im XML-Dokument (nach der Expandierung von Entities). Attribut- und Namensraumknoten eines Elements kommen vor den Kindern des Elements. Namensraumknoten erscheinen per Definition vor den Attributknoten. Die relative Ordnung innerhalb der Namensraumknoten ist implementationsabhï¿½ngig. Die relative Ordnung innerhalb der Attributknoten ist implementationsabhï¿½ngig. Die umgekehrte Dokumentordnung ist die Umkehrung der Dokumentordnung.

Anmerkung des ï¿½bersetzers:

Damit ist fï¿½r Attribut- und Namensraumknoten die Reihenfolge der Reprï¿½sentation im XML-Dokument unerheblich.

Man darf an dieser Stelle nicht vergessen, dass die Elemente einer Knotenmenge trotzdem immer ungeordnet sind. Die Eigenschaft, die Knoten einer Menge in einer bestimmten Reihenfolge zu betrachten, gehï¿½rt immer zu einer Operation oder Funktion, die auf dieser Menge ausgefï¿½hrt wird. So konvertieren die Funktionen string, boolean und number bei einer gegebenen Knotenmenge immer den ersten Knoten bezï¿½glich der Dokumentordnung. Entsprechend legen auf Ausdrï¿½cke angewandte Prï¿½dikate immer die Dokumentordnung zugrunde. Demgegenï¿½ber legt innerhalb eines Lokalisierungsschrittes immer die jeweilige Achse die fï¿½r die dazugehï¿½renden Prï¿½dikate relevante Ordnung fest. Nachdem eine Knotenmenge konstruiert wurde, ist sie (wieder) ungeordnet. Siehe dazu auch die entsprechende Anmerkung in Kapitel [3.3 Knotenmengen].

Wurzel- und Elementknoten besitzen eine geordnete Liste von Kindknoten. Mehrere Knoten haben niemals gemeinsame Kinder: Wenn ein Knoten von einem anderen Knoten verschieden ist, dann ist kein Kindknoten des einen Knotens mit einem der Kindknoten des anderen Knotens identisch. Jeder Knoten mit Ausnahme des Wurzelknotens besitzt genau einen Elternknoten, wobei dieser entweder ein Elementknoten oder der Wurzelknoten ist. Ein Wurzel- oder ein Elementknoten ist der Elternknoten jedes seiner Kindknoten. Die Nachkommen eines Knotens sind die Kinder des Knotens sowie die Nachkommen der Kinder des Knotens.

Anmerkung des ï¿½bersetzers:

Die Bezeichnungen Eltern- und Kindknoten sind vielleicht nicht ganz glï¿½cklich. Jeder Knoten besitzt nï¿½mlich maximal einen Elternknoten. Daneben sind Attribut- und Namensraumknoten vergleichbar mit rebellierenden Teenagern, die im XPath-Datenmodell nicht als Kinder ihrer Element-Elternknoten betrachtet werden.

5.1 Wurzelknoten

Der Wurzelknoten ist die Wurzel des Baumes. Ein Wurzelknoten kommt nur als Wurzel des Baumes vor. Der Elementknoten fï¿½r das Dokumentelement ist ein Kind des Wurzelknotens. Der Wurzelknoten hat als Kinder ebenfalls Processing-Instruction-Knoten und Kommentarknoten fï¿½r Processing Instructions und Kommentare, die im Prolog oder hinter dem Ende des Dokumentelements auftreten.

Anmerkung des ï¿½bersetzers:

Die Dokumenttyp-Deklaration ist kein Kind des Wurzelknotens. Sie kommt als solche an keiner Stelle im XPath-Datenmodell vor. So kann ein XSLT-Stylesheet keine Kopie der Dokumenttyp-Deklaration erzeugen. Ebenso werden innerhalb der Dokumenttyp-Deklaration auftretende Kommentare oder Processing Instructions nicht durch XPath-Knoten reprï¿½sentiert.

Der Zeichenkettenwert des Wurzelknotens ergibt sich aus der Verkettung der Zeichenkettenwerte aller Textknoten in Dokumentordnung, die Nachkommen des Wurzelknotens sind.

Anmerkung des ï¿½bersetzers:

Da auï¿½erhalb des Dokumentelements keine Textknoten auftreten dï¿½rfen, gilt also

string(/) = string(/*)

oder mit anderen Worten: Der Wurzelknoten und sein (einziger) Element-Kindknoten besitzen den gleichen Zeichenkettenwert. Diesen erhï¿½lt man auch, wenn aus dem Eingabedokument jegliches Markup entfernt und nur die Zeichendaten behalten werden.

Zum Vergleich: Im Document Object Model [DOM] ist der Wert des vergleichbaren Attributs nodeValue fï¿½r ein Document-Objekt dagegen die leere Zeichenkette.

Der Wurzelknoten hat keinen erweiterten Namen.

Anmerkung des ï¿½bersetzers:

Das bedeutet, dass die Funktionen name, local-name und namespace-uri als Ergebnis die leere Zeichenkette liefern. Das in DOM definierte Attribut nodeName besitzt dagegen fï¿½r das Document-Objekt als Wert die Zeichenkette ï¿½#documentï¿½.

5.2 Elementknoten

Fï¿½r jedes Element im Dokument gibt es einen Elementknoten. Ein Elementknoten besitzt einen erweiterten Namen, der sich durch Expandierung des im Tag des Elements spezifizierten QName in ï¿½bereinstimmung mit der XML-Namensraum-Empfehlung [XML Names] ergibt. Der Namensraum-URI des erweiterten Namens des Elements ist leer, wenn der QName kein Prï¿½fix enthï¿½lt und es keinen anwendbaren voreingestellten Namensraum gibt.

Anmerkung: In der im Anhang A.3 von [XML Names] verwendeten Notation entspricht der lokale Teil des erweiterten Namens dem Attribut type des Elements ExpEType; der Namensraum-URI des erweiterten Namens entspricht dem Attribut ns des Elements ExpEType und ist leer, wenn das Attribut ns des Elements ExpEType weggelassen wurde.

Die Kinder eines Elementknotens sind die enthaltenen Elementknoten, Kommentarknoten, Processing-Instruction-Knoten und Textknoten. Entity-Referenzen zu internen und externen Entities werden expandiert. Zeichenreferenzen werden aufgelï¿½st.

Der Zeichenkettenwert eines Elementknotens ergibt sich aus der Verkettung der Zeichenkettenwerte aller Textknoten, die Nachkommen des Elementknotens in Dokumentordnung sind.

Anmerkung des ï¿½bersetzers:

Damit gilt, dass der Zeichenkettenwert eines Elementknotens genauso als Verkettung der Zeichenkettenwerte seiner Element- und Textkinder in Dokumentordnung aufgefasst werden kann.

Zum Vergleich: Im Document Object Model [DOM] ist dagegen der Wert des vergleichbaren Attributs nodeValue fï¿½r ein Element-Objekt die leere Zeichenkette.

5.2.1 Eindeutige IDs

Ein Elementknoten kann einen eindeutigen Bezeichner (ID) besitzen. Dies ist der Wert des Attributes, das in der DTD mit dem Typ ID deklariert wurde. Keine zwei Elemente in einem Dokument dï¿½rfen den gleichen eindeutigen Bezeichner besitzen. Falls ein XML-Prozessor zwei Elemente in einem Dokument mit dem gleichen eindeutigen Bezeichner meldet (was nur mï¿½glich ist, wenn das Dokument ungï¿½ltig ist), dann muss das zweite Element in Dokumentordnung so behandelt werden, als habe es keinen eindeutigen Bezeichner.

Anmerkung: Wenn ein Dokument keine DTD besitzt, dann hat kein Element des Dokuments einen eindeutigen Bezeichner.

Anmerkung des ï¿½bersetzers:

Fï¿½r zwei oder mehr Elemente mit dem gleichen eindeutigen Bezeichner liefert die Funktion id nur den ersten Elementknoten in Dokumentordnung zurï¿½ck. Da die Eigenschaft eines Attributes, eindeutiger Bezeichner zu sein, in der DTD deklariert wird, kann ohne DTD dieses Attribut nicht mehr erkannt werden. Das bedeutet, dass die Funktion id nach dem Entfernen der DTD aus dem Eingabedokument fï¿½r jedes Argument nur noch die leere Knotenmenge liefert. Dies ist einer der wenigen Fï¿½lle, in denen die Existenz einer DTD sich auf die Auswertung eines XPath-Ausdrucks auswirkt.

5.3 Attributknoten

Jedes Element besitzt eine mit ihm verbundene Menge von Attributknoten; das Element ist der Elternknoten jedes dieser Attributknoten. Allerdings ist ein Attributknoten kein Kind seines Elternknotens.

Anmerkung: Dies unterscheidet sich vom DOM, welches ein Element nicht als Elternknoten seiner Attribute behandelt (siehe [DOM]).

Mehrere Elemente haben niemals gemeinsame Attributknoten: Wenn ein Elementknoten verschieden von einem anderen Elementknoten ist, dann ist kein Attributknoten des einen Elementknotens mit einem der Attributknoten eines anderen Elementknotens identisch.

Anmerkung: Der Operator = testet, ob zwei Knoten den gleichen Wert haben, nicht ob es dieselben Knoten sind. Vergleicht man die Attribute von zwei verschiedenen Elementen mittels =, so kann sich Gleichheit ergeben, obwohl diese nicht dieselben Knoten sind.

Anmerkung des ï¿½bersetzers:

Wert bedeutet hier wieder Zeichenkettenwert. Tatsï¿½chlich gilt die obige Anmerkung fï¿½r alle Knoten, nicht nur fï¿½r Attribute. Um die Identitï¿½t zweier Knoten zu ï¿½berprï¿½fen, kann man sich beispielsweise der in Kapitel [3.3 Knotenmengen] im Zusammenhang mit dem Operator | vorgestellten Technik bedienen.

Ein vorgegebenes Attribut wird genauso behandelt wie ein spezifiziertes Attribut. Falls fï¿½r einen Elementtyp ein Attribut in der DTD deklariert wurde, der Vorgabewert jedoch als #IMPLIED deklariert und das Attribut fï¿½r das Element nicht angegeben wurde, so enthï¿½lt die Attributmenge des Elements keinen Knoten fï¿½r dieses Attribut.

Anmerkung des ï¿½bersetzers:

Beispiel:

]>

In diesem Fall besitzt der einzige Elementknoten see im XPath-Datenmodell genau einen Attributknoten namens access mit dem Wert public. Im Gegensatz zu ref handelt es sich bei access um ein vorgegebenes Attribut.

Das XPath-Datenmodell liefert keinerlei Informationen darï¿½ber, ob ein solches Attribut im Start-Tag eines Elements spezifiziert wurde oder nicht. Im zweiten Fall ï¿½ndert sich im Falle des Entfernens der DTD die Baumreprï¿½sentation des XML-Dokuments, da alle vorgegebenen, aber nicht spezifizierten Attribute wegfallen.

Einige Attribute, wie xml:lang und xml:space, besitzen die Semantik, dass sie fï¿½r alle Elemente gelten, die Nachkommen des Elements sind, das das Attribut trï¿½gt, es sei denn, sie wurden in einer Instanz eines Nachkommenelements durch das gleiche Attribut ï¿½berschrieben. Das wirkt sich allerdings nicht darauf aus, wo Attributknoten im Baum vorkommen: Ein Element besitzt nur Attributknoten fï¿½r die Attribute, die explizit im Start-Tag oder Leeres-Element-Tag dieses Elements angegeben wurden oder die in der DTD explizit mit einem Vorgabewert deklariert wurden.

Anmerkung des ï¿½bersetzers:

Im Zusammenhang mit der Funktion lang wurde auf diese Eigenschaft bereits hingewiesen. Ein Attribut xml:lang wirkt sich zwar semantisch auf die Nachkommen aus, allerdings erscheint es nicht implizit als Attributknoten bei diesen Nachkommen.

Damit liefert z.B. //*[lang('de')] in der Regel eine andere Knotenmenge als //*[@xml:lang='de']. Im ersten Ausdruck werden alle die Knoten ausgewï¿½hlt, fï¿½r die selbst oder fï¿½r deren nï¿½chsten Vorfahren die Sprache Deutsch (de) festgelegt wurde. Der zweite Ausdruck wï¿½hlt dagegen nur die Knoten aus, die ein Attribut xml:lang explizit oder als Vorgabewert mit dem Wert de besitzen. Abgesehen davon wï¿½rde die zweite Variante auch Attribute wie xml:lang="DE-CH" unberï¿½cksichtigt lassen.

Ein Attributknoten hat einen erweiterten Namen und einen Zeichenkettenwert. Der erweiterte Name wird durch Expandierung des im Tag im XML-Dokument angegebenen QName in ï¿½bereinstimmung mit der XML-Namensraum-Empfehlung [XML Names] berechnet. Der Namensraum-URI des Attributnamens ist leer, falls der QName des Attributs kein Prï¿½fix enthï¿½lt.

Anmerkung des ï¿½bersetzers:

Entsprechend der XML-Namensraum-Empfehlung [XML Names] wirkt sich somit ein voreingestellter Namensraum im Gegensatz zu Elementknoten nicht auf Attribute ohne Prï¿½fix aus.

Anmerkung: In der im Anhang A.3 von [XML Names] verwendeten Notation entspricht der lokale Teil des erweiterten Namens dem Attribut name des Elements ExpAName; der Namensraum-URI des erweiterten Namens entspricht dem Attribut ns des Elements ExpAName und ist leer, wenn das Attribut ns des Elements ExpAName weggelassen wurde.

Ein Attributknoten besitzt einen Zeichenkettenwert. Dieser Zeichenkettenwert ist der durch die XML-Empfehlung [XML] spezifizierte normalisierte Wert. Ein Attribut, dessen normalisierter Wert eine Zeichenkette der Lï¿½nge null ist, wird nicht gesondert behandelt: Es resultiert in einem Attributknoten, dessen Zeichenkettenwert eine Zeichenkette der Lï¿½nge null ist.

Anmerkung des ï¿½bersetzers:

Normalisierung bedeutet, dass alle Entity- und Zeichenreferenzen aufgelï¿½st sowie alle Leerraumzeichen durch die gleiche Anzahl Leerzeichen ersetzt werden. Ist der Attributtyp nicht CDATA, wird der Attributwert darï¿½ber hinaus wie bei der Anwendung der Funktion normalize-space umgewandelt.

Anmerkung: Es ist mï¿½glich, dass Attribute mit Vorgabewerten in einer externen DTD oder einem externen Parameter-Entity deklariert werden. Die XML-Empfehlung verlangt nicht, dass ein XML-Prozessor eine externe DTD oder ein externes Parameter-Entity einliest, es sei denn, dieser ist validierend. Ein Stylesheet oder ein anderes Werkzeug, das annimmt, der XPath-Baum enthalte in einer externen DTD oder einem externen Parameter-Entity deklarierte Vorgabewerte, kann mï¿½glicherweise mit nicht-validierenden XML-Prozessoren nicht funktionieren.

Es gibt keine Attributknoten zu Attributen, die Namensrï¿½ume deklarieren (siehe [XML Names]).

Anmerkung des ï¿½bersetzers:

Attribute mit dem Namen ï¿½xmlnsï¿½ oder dem Prï¿½fix ï¿½xmlnsï¿½ werden nicht als Attributknoten, sondern als Namensraumknoten im Datenmodell reprï¿½sentiert.

5.4 Namensraumknoten

Jedem Element ist eine Menge von Namensraumknoten zugeordnet, einer fï¿½r jedes einzelne Namensraum-Prï¿½fix, das fï¿½r das Element gï¿½ltig ist (einschlieï¿½lich des Prï¿½fixes xml, das implizit durch die XML-Namensraum-Empfehlung deklariert wird) und einer fï¿½r den voreingestellten Namensraum, falls einer fï¿½r das Element gï¿½ltig ist. Das Element ist der Elternknoten jedes dieser Namensraumknoten; ein Namensraumknoten ist allerdings kein Kind seines Elternelements. Mehrere Elemente haben niemals gemeinsame Namensraumknoten: Wenn ein Elementknoten verschieden von einem anderen Elementknoten ist, dann ist kein Namensraumknoten des einen Elementknotens mit einem der Namensraumknoten eines anderen Elementknotens identisch. Das bedeutet, ein Element besitzt einen Namensraumknoten:

fï¿½r jedes Attribut des Elements, dessen Name mit xmlns: beginnt;
fï¿½r jedes Attribut eines Vorfahrenelements, dessen Name mit xmlns: beginnt, es sei denn, das Element selbst oder ein nï¿½herer Vorfahre deklariert das Prï¿½fix um;
fï¿½r ein xmlns-Attribut, falls das Element oder ein Vorfahre ein xmlns-Attribut besitzt und der Wert des xmlns-Attributs beim nï¿½chsten dieser Elemente nicht leer ist.

Anmerkung: Ein Attribut xmlns="" "undeklariert" den voreingestellten Namensraum (siehe [XML Names]).

Anmerkung des ï¿½bersetzers:

Namensraumdeklarationen wirken sich damit in der Regel auf die Nachkommen des Elements aus, in dem diese Deklaration erscheint. Im Gegensatz zu den Attributen xml:lang und xml:space werden Namensraumknoten jedoch tatsï¿½chlich an die Nachkommen vererbt. Jeder Elementknoten besitzt ein eigenes Knoten-Exemplar fï¿½r jeden gï¿½ltigen Namensraum.

Wie bereits in Kapitel [1 Einleitung] an einem Beispiel verdeutlicht wurde, folgt aus der Namensraum-Empfehlung, dass jedes Element wenigstens einen Namensraumknoten mit dem Prï¿½fix xml und dem Namensraum-URI http://www.w3.org/XML/1998/namespace besitzt.

Da das XPath-Datenmodell keine Informationen darï¿½ber enthï¿½lt, an welchen Stellen Namensraumdeklarationen im Dokument auftreten, besitzen die Beispiele

und

die gleiche Baumreprï¿½sentation.

Ein Namensraumknoten besitzt einen erweiterten Namen: Der lokale Teil ist das Namensraum-Prï¿½fix (dieses ist leer, falls der Namensraumknoten den voreingestellten Namensraum reprï¿½sentiert); der Namensraum-URI ist immer leer.

Der Zeichenkettenwert eines Namensraumknotens ist der Namensraum-URI, der an das Namensraum-Prï¿½fix gebunden ist. Wenn dieser relativ ist, muss er wie ein Namensraum-URI in einem erweiterten Namen aufgelï¿½st werden.

Anmerkung des ï¿½bersetzers:

Nach einer Entscheidung des W3C-XML-Plenums ist die Behandlung relativer Namensraum-URIs implementationsabhï¿½ngig. Gemï¿½ï¿½ Errata-Dokument [XPath Errata] muss dieser letzte Absatz durch den folgenden ersetzt werden:

Der Zeichenkettenwert eines Namensraumknotens ist der Namensraum-URI, der an das Namensraum-Prï¿½fix gebunden ist; wenn der in der Namensraumdeklaration auftretende Namensraum-Name ein relativer URI (mit oder ohne Fragment-Bezeichner) ist, so ist der Zeichenkettenwert implementationsabhï¿½ngig. Ein XPath-Ausdruck, der vom Zeichenkettenwert eines solchen Namensraumknotens abhï¿½ngt, ist nicht interoperabel.

Die Definition des erweiterten Namens fï¿½r Namensraumknoten mag auf den ersten Blick etwas ungewï¿½hnlich erscheinen. Tatsï¿½chlich wurde hier das Namensraum-Prï¿½fix als eigentlich relevanter Namensbestandteil dem Schema fï¿½r erweiterte Namen angepasst, den jeder Knoten besitzt. Der Namensraum-URI des Namens ist leer, da der Name eines Namensraumknotens nicht von anderen gï¿½ltigen Namensraumdeklarationen abhï¿½ngt.

Zur Illustration zwei Beispiele: Die Deklaration xmlns:prefix="urn:eindeutiger-bezeichner" erzeugt einen Namensraumknoten, dessen erweiterter Name gleich [ï¿½prefixï¿½, ï¿½ï¿½] ist. Eine Deklaration fï¿½r den voreingestellten Namensraum xmlns="urn:eindeutiger-bezeichner" fï¿½hrt zu einem Knoten mit dem erweiterten Namen [ï¿½ï¿½, ï¿½ï¿½]. Der Zeichenkettenwert ist in beiden Fï¿½llen ï¿½urn:eindeutiger-bezeichnerï¿½. Ein Namensraumknoten hat niemals einen leeren Zeichenkettenwert.

Namensraumknoten werden benï¿½tigt, wenn in den Daten enthaltene qualifizierte Namen ausgewertet werden sollen. Die Typangabe in einem XML-Schema ist so ein Beispiel: type="ob:adresse". Zur Ermittlung des dazugehï¿½rigen Namensraum-URIs kann folgender Ausdruck verwendet werden:

string(namespace::*[name()=substring-before(../@type,':')])

Da der Namensraumknoten fï¿½r den voreingestellten Namensraum einen leeren Namen besitzt und daher nicht direkt als Knotentest angegeben werden kann, lï¿½sst sich ein solcher Knoten nur mit Hilfe eines geeigneten Prï¿½dikats auswï¿½hlen:

namespace::*[name()='']

5.5 Processing-Instruction-Knoten

Fï¿½r jede Processing Instruction gibt es einen Processing-Instruction-Knoten, mit Ausnahme der Processing Instructions, die innerhalb der Dokumenttyp-Deklaration erscheinen.

Eine Processing Instruction besitzt einen erweiterten Namen: Der lokale Teil ist das Ziel der Processing Instruction; der Namensraum-URI ist leer. Der Zeichenkettenwert eines Processing-Instruction-Knotens ist der Teil der Processing Instruction, der dem Ziel und allem Leerraum folgt. Dieser beinhaltet nicht das abschlieï¿½ende ?>.

Anmerkung des ï¿½bersetzers:

Die folgende Processing Instruction

wird z.B. durch einen Knoten reprï¿½sentiert, dessen erweiterter Name [ï¿½xml-stylesheetï¿½, ï¿½ï¿½] und dessen Zeichenkettenwert ï¿½href='style.xsl' title='Hauptstylesheet'ï¿½ ist.

Die Abschnitte, die hier wie Attribute einer Processing Instruction aussehen (href und title), sind in Wirklichkeit nur Teile des Inhalts, also des Zeichenkettenwerts. Durch XPath werden an dieser Stelle keine Attributknoten bereitgestellt. Mï¿½chte man auf diese Pseudo-Attribute zugreifen, muss man sich mit den Funktionen fï¿½r Zeichenketten behelfen.

Namensraumdeklarationen wirken sich nicht auf Processing Instructions aus.

Anmerkung: Die XML-Deklaration ist keine Processing Instruction. Daher gibt es auch keinen Processing-Instruction-Knoten fï¿½r die XML-Deklaration.

Anmerkung des ï¿½bersetzers:

Es ist nicht mï¿½glich, auf die Angaben innerhalb der XML-Deklaration zuzugreifen. Die Versionsnummer und die Kodierungsangabe gehï¿½ren nicht zum XPath-Datenmodell.

5.6 Kommentarknoten

Fï¿½r jeden Kommentar gibt es einen Kommentarknoten, mit Ausnahme der Kommentare, die innerhalb der Dokumenttyp-Deklaration erscheinen.

Der Zeichenkettenwert eines Kommentarknotens ist der Inhalt des Kommentars ohne die ï¿½ffnenden Zeichen .

Ein Kommentarknoten besitzt keinen erweiterten Namen.

Anmerkung des ï¿½bersetzers:

Das bedeutet, dass die Funktionen name, local-name und namespace-uri als Ergebnis die leere Zeichenkette liefern. Das in DOM definierte Attribut nodeName besitzt dagegen fï¿½r ein Comment-Objekt als Wert die Zeichenkette ï¿½#commentï¿½.

5.7 Textknoten

Zeichendaten werden in Textknoten zusammengefasst. Dabei werden so viele Zeichen wie mï¿½glich in jedem Textknoten zusammengefasst: Ein Textknoten hat niemals als direkten Vorgï¿½nger oder Nachfolger einen anderen Textknoten. Der Zeichenkettenwert eines Textknotens besteht aus den Zeichendaten. Ein Textknoten enthï¿½lt immer wenigstens ein Zeichen.

Jedes Zeichen innerhalb eines CDATA-Abschnittes wird wie Zeichendaten behandelt. So wird im Quelldokument genauso behandelt wie <. Beides ergibt das einzelne Zeichen < in einem Textknoten innerhalb des Baumes. Ein CDATA-Abschnitt wird damit so behandelt, als wï¿½rden und ]]> entfernt und jedes Vorkommen von < und & durch < bzw. & ersetzt werden.


      
      
      
         
            
               Anmerkung des ï¿½bersetzers:
               
               
                  Das XPath-Datenmodell enthï¿½lt also keinerlei Informationen darï¿½ber, in
                  welcher Form ein Zeichen innerhalb des XML-Dokuments reprï¿½sentiert 
                  war. Die folgenden Textinhalte des Elements x werden alle
                  auf den gleichen Textknoten mit dem Inhalt ï¿½Aï¿½ abgebildet:
                  
               
               A

A
A

               
                  Entsprechend wï¿½rde beispielsweise der Inhalt des folgenden Elements
                  para in einem einzigen Textknoten zusammengefasst werden.
                  Der Beginn des CDATA-Abschnittes kann in XPath nicht bestimmt werden.
                  Das Document Object Model [DOM] sieht hier stattdessen
                  spezielle Objekte Text und CDATASection vor.
                  
               
               
   Hier folgen Beispiel & Erklï¿½rung:
    10 and a < 20]]> bedeutet ...


               
                  Einzelne Zeichendaten werden innerhalb des Datenmodells nicht separat
                  reprï¿½sentiert. Zur Verarbeitung muss deshalb auf die bereitgestellten
                  Zeichenkettenfunktionen zurï¿½ckgegriffen werden.
                  
               
               
            
         
      
      
      
      
      Anmerkung: Wird ein Textknoten, der das Zeichen <
         enthï¿½lt, als XML ausgegeben, so muss das Zeichen <
         geschï¿½tzt werden, beispielsweise durch < oder
         durch Einschluss in einen CDATA-Abschnitt.
      
      
      
      
      Zeichen innerhalb von Kommentaren, Processing Instructions und
         Attributwerten erzeugen keine Textknoten. Zeilenenden in externen
         Entities werden zu #xA normalisiert, so wie in der
         XML-Empfehlung [XML] spezifiziert.
      
      
      
      
      
         
            
               Anmerkung des ï¿½bersetzers:
               
               
                  Gemï¿½ï¿½ Errata-Dokument [XPath Errata] muss an dieser Stelle 
                  folgender Satz eingefï¿½gt werden:
                  
               
               
                  Leerraum auï¿½erhalb des 
                  Dokumentelements erzeugt keine Textknoten.
                  
               
               
                  Genau genommen lï¿½sst sich durch XPath nicht beeinflussen, ob Leerraum 
                  generell Textknoten erzeugen soll. Abhï¿½ngig von der Applikation, die
                  XPath verwendet, werden fï¿½r ausschlieï¿½lich aus Leerraum bestehende
                  Bereiche Textknoten angelegt oder nicht. Die Illustration zum Beispiel
                  in Kapitel [1 Einleitung] beruht auf der Annahme, dass 
                  solche Leerraum-Textknoten vorhanden sind. Das ist auch das 
                  Standardverhalten in XSLT [XSLT] fï¿½r zu verarbeitende
                  XML-Dokumente. Durch Verwendung der XSLT-Elemente 
                  xsl:strip-space und xsl:preserve-space lï¿½sst 
                  sich dieses Verhalten allerdings beeinflussen. Darï¿½ber hinaus werden 
                  Leerraum-Textknoten, die als Kind eines Elements mit 
                  xml:space="preserve" (siehe [XML, 2nd Edition]) 
                  auftreten, niemals entfernt.
                  
               
               
                  Die Existenz solcher Leerraum-Textknoten kann sich auf Kontextgrï¿½ï¿½e
                  und -position und damit auf das Ergebnis der Funktionen
                  last, position und
                  count auswirken. Die Berechnung des Ausdrucks 
                  name/text()[1] fï¿½r das folgende Beispiel hï¿½ngt 
                  entscheidend davon ab, ob Leerraum-Textknoten mitgezï¿½hlt werden oder 
                  nicht:
                  
               
               
   Herr Mï¿½ller-Lï¿½denscheidt


               
         
      
      
      
      
      Ein Textknoten besitzt keinen erweiterten Namen.
      
      
      
      
         
            
               Anmerkung des ï¿½bersetzers:
               
               
                  Das bedeutet, dass die Funktionen name, 
                  local-name und namespace-uri 
                  als Ergebnis die leere Zeichenkette liefern. Das in DOM definierte 
                  Attribut nodeName besitzt dagegen fï¿½r 
                  Text-Objekte als Wert die Zeichenkette 
                  ï¿½#textï¿½ und fï¿½r CDATASection-Objekte den
                  Wert ï¿½#cdata-sectionï¿½.
                  
               
               
            
         
      
      
      
      
      
      
      
      
      
      6 Konformitï¿½t
      
      
      
      
      XPath ist in erster Linie als Komponente gedacht, die von anderen
         Spezifikationen genutzt werden kann. Demzufolge ï¿½berlï¿½sst es XPath den
         Spezifikationen, die XPath nutzen (etwa [XPointer] und 
         [XSLT]), Kriterien fï¿½r die Konformitï¿½t von XPath zu 
         spezifizieren und definiert selbst keinerlei Konformitï¿½tskriterien fï¿½r 
         unabhï¿½ngige XPath-Implementationen.
      
      
      
      
         
            
               Anmerkung des ï¿½bersetzers:
               
               
                  Die Organisation Oasis hat eine Kommission fï¿½r die Konformitï¿½t von 
                  XSLT- und XPath-Implementationen [XSLT-Konformitï¿½t] gebildet,
                  die geeignete Szenarien fï¿½r eine Test-Suite zusammenstellt.
                  
               
               
            
         
      
      
      
      
      
      
      
      
      
      
      
      A Referenzen
      
      
      
      
      A.1 Normative Referenzen
      
      
      
      
         
         
         IEEE 754
         Institute of Electrical and
            Electronics Engineers: IEEE Standard for Binary Floating-Point
               Arithmetic. ANSI/IEEE Std 754-1985.
         
         
         
         
         RFC2396
         T. Berners-Lee, R. Fielding und
            L. Masinter: Uniform Resource Identifiers (URI): Generic
               Syntax. IETF RFC 2396. Siehe http://www.ietf.org/rfc/rfc2396.txt.
         
         
         
         
         XML
         World Wide Web Consortium: Extensible
               Markup Language (XML) 1.0. W3C Recommendation. Siehe http://www.edition-w3c.de/TR/1998/REC-xml-19980210.
         
         
         
         
         XML Names
         World Wide Web Consortium:
            Namespaces in XML. W3C Recommendation. Siehe http://www.edition-w3c.de/TR/REC-xml-names.
         
         
         
      
      
      
      
      
      
      A.2 Andere Referenzen
      
      
      
      
         
         
         
         Character Model
         World Wide Web Consortium:
            Character Model for the World Wide Web. W3C Working
            Draft. Siehe http://www.edition-w3c.de/TR/WD-charmod.
         
         
         
         
         DOM
         World Wide Web Consortium:  Document
               Object Model (DOM) Level 1 Specification. W3C
            Recommendation. Siehe http://www.edition-w3c.de/TR/REC-DOM-Level-1.
         
         
         
         
         JLS
         J. Gosling, B. Joy und G. Steele:  The
               Java Language Specification. Siehe http://java.sun.com/docs/books/jls/index.html.
         
         
         
         
         ISO/IEC 10646
         ISO (International
            Organization for Standardization):  ISO/IEC 10646-1:1993,
               Information technology â€” Universal Multiple-Octet Coded Character Set
               (UCS) â€” Part 1: Architecture and Basic Multilingual Plane.
            Internationaler Standard. Siehe http://www.iso.ch/cate/d18741.html.
         
         
         
         
         
         TEI
         C.M. Sperberg-McQueen und L. Burnard:
            Guidelines for Electronic Text Encoding and
               Interchange. Siehe http://etext.virginia.edu/TEI.html.
         
         
         
         
         Unicode
         Unicode Consortium: The Unicode
               Standard.  Siehe http://www.unicode.org/unicode/standard/standard.html.
         
         
         
         
         XML Infoset
         World Wide Web Consortium: 
            XML Information Set. W3C Working Draft. Siehe http://www.edition-w3c.de/TR/xml-infoset.
            
         
         
         
         
         XPointer
         World Wide Web Consortium: XML
               Pointer Language (XPointer). W3C Working Draft. Siehe http://www.edition-w3c.de/TR/WD-xptr.
         
         
         
         
         XQL
         J. Robie, J. Lapp und D. Schach:
            XML Query Language (XQL). Siehe
            http://www.w3.org/TandS/QL/QL98/pp/xql.html.
         
         
         
         
         XSLT
         World Wide Web Consortium:  XSL
               Transformations (XSLT). W3C Recommendation.  Siehe http://www.edition-w3c.de/TR/xslt.
         
         
         
      
      
      
      
      
      
      
      
      
      
      B Abbildung auf die XML-Informationsmenge (nicht normativ)
      
      
      
      
      Die Knoten im XPath-Datenmodell lassen sich aus den durch die
         XML-Informationsmenge [XML Infoset] bereitgestellten
         Informationseinheiten wie folgt ableiten.
      
      
      
      
      Anmerkung: Eine neue Version des Arbeitsentwurfs der 
         XML-Informationsmenge, die die Version vom 17. Mai (1999,
         der ï¿½bersetzer) ersetzen wird, war zu der Zeit, als die 
         Vorbereitung dieser Version der XPath-Spezifikation vollendet wurde,
         kurz vor der Fertigstellung. Ihre Verï¿½ffentlichung wurde zur gleichen
         Zeit oder kurz nach Verï¿½ffentlichung dieser Version von XPath erwartet.
         Die Abbildung wird fï¿½r diese neue Version des Arbeitsentwurfs der
         XML-Informationsmenge angegeben. Falls die neue Version des
         Arbeitsentwurfs der XML-Informationsmenge noch nicht verï¿½ffentlicht 
         worden sein sollte,
         kï¿½nnen W3C-Mitglieder die interne Arbeitsgruppenversion 
            http://www.w3.org/XML/Group/1999/09/WD-xml-infoset-19990915.html
         (nur fï¿½r Mitglieder)
         einsehen.
      
      
      
      
         
            
               Anmerkung des ï¿½bersetzers:
               
               
                  Die XML-Informationsmenge beschreibt die aus einem XML-Dokument 
                  ableitbaren Informationen auf einer abstrakten Ebene. Zu diesem Zweck 
                  wurden elf Typen, so genannte Informationseinheiten
                  (information items) definiert. Jede dieser Informationseinheiten 
                  besitzt eine Reihe von Eigenschaften (properties).
                  Es wurde in der XML-Informationsmenge bewusst nicht der Term 
                  "Knoten" verwendet, um Verwechslungen mit DOM- und 
                  XPath-Knoten zu vermeiden. Die im XPath-Datenmodell definierten 
                  Knotentypen beschreiben eine Teilmenge der in der XML-Informationsmenge
                  verfï¿½gbaren Informationen und lassen sich daher aus diesen 
                  Informationseinheiten ableiten.
                  
               
               
                  Die XML-Informationsmenge ist am 24. Oktober 2001 als W3C-Empfehlung 
                  verabschiedet worden. Im Vergleich zu der hier angesprochenen Version 
                  vom Dezember 1999 haben sich einige Details geï¿½ndert. Die sich daraus 
                  ergebenden ï¿½nderungen bei der Abbildung des XPath-Datenmodells werden 
                  im Folgenden in den jeweiligen Anmerkungen angegeben.
                  
               
               
            
         
      
      
      
      
         
         
         
         
            Der Wurzelknoten folgt aus der Dokument-Informationseinheit. 
               Die Kinder des Wurzelknotens folgen aus den Eigenschaften 
               children und 
               children - comments.
            
            
            
            
               
                  
                     Anmerkung des ï¿½bersetzers:
                     
                     
                        Die Eigenschaft children - comments
                        gibt es nicht mehr. Stattdessen folgen mï¿½gliche Kommentar-Kindknoten
                        des Wurzelknotens ebenfalls unmittelbar aus der Eigenschaft 
                        children.
                        
                     
                     
                  
               
            
            
         
         
         
         
         
            Ein Elementknoten folgt aus einer Element-Informationseinheit.
               Die Kinder eines Elementknotens folgen aus den Eigenschaften children und children - comments. Die Attribute eines
               Elementknotens folgen aus der Eigenschaft attributes. Die Namensrï¿½ume eines
               Elementknotens folgen aus der Eigenschaft in-scope namespaces. Der lokale Teil
               des erweiterten Namens
               eines Elementknotens folgt aus der Eigenschaft local name. Der Namensraum-URI des
               erweiterten Namens eines
               Elementknotens folgt aus der Eigenschaft namespace URI. Der eindeutige Bezeichner
               (ID) eines Elementknotens folgt aus der Eigenschaft children der 
               Attribut-Informationseinheit in der Eigenschaft attributes, deren Eigenschaft attribute type gleich ID 
               ist.
            
            
            
            
               
                  
                     Anmerkung des ï¿½bersetzers:
                     
                     
                        Die Eigenschaft children - comments
                        gibt es nicht mehr. Stattdessen folgen mï¿½gliche Kommentar-Kindknoten
                        eines Elementknotens ebenfalls unmittelbar aus der Eigenschaft 
                        children.
                        Der Namensraum-URI des erweiterten 
                           Namens eines Elementknotens folgt aus der Eigenschaft namespace name.
                        Der eindeutige Bezeichner (ID) eines Elementknotens folgt aus der 
                        Eigenschaft normalized value der 
                        Attribut-Informationseinheit in der Eigenschaft attributes, deren Eigenschaft attribute type gleich ID 
                        ist.
                        
                     
                     
                  
               
            
            
         
         
         
         
         
            Ein Attributknoten folgt aus einer
               Attribut-Informationseinheit. Der lokale Teil des erweiterten Namens des Attributknotens
               folgt aus der Eigenschaft local 
                  name. Der Namensraum-URI des erweiterten Namens des Attributknotens
               folgt aus der Eigenschaft namespace 
                  URI. Der Zeichenkettenwert des Knotens folgt
               aus der Verkettung aller Eigenschaften character code jedes Bestandteils der
               Eigenschaft children.
            
            
            
            
               
                  
                     Anmerkung des ï¿½bersetzers:
                     
                     
                        Der Namensraum-URI des erweiterten 
                           Namens eines Attributknotens folgt aus der Eigenschaft namespace name.
                        Der Zeichenkettenwert des 
                        Knotens folgt aus der Eigenschaft 
                        normalized value.
                        Attributwerte werden gemï¿½ï¿½ der aktuellen Version der 
                        XML-Informationsmenge nicht weiter in einzelne 
                        Zeichen-Informationseinheiten zerlegt.
                        
                     
                     
                  
               
            
            
         
         
         
         
         
            Ein Textknoten folgt aus einer Folge einer oder mehrerer
               aufeinander folgender Zeichen-Informationseinheiten. Der Zeichenkettenwert des Knotens folgt
               aus der Verkettung der Eigenschaften character code aller 
               Zeichen-Informationseinheiten.
            
         
         
         
         
         
            Ein Processing-Instruction-Knoten folgt aus einer
               Processing-Instruction-Informationseinheit. Der lokale Teil des
               erweiterten Namens des Knotens folgt
               aus der Eigenschaft target.
               (Der Teil Namensraum-URI des erweiterten Namens des Knotens ist
               leer.) Der Zeichenkettenwert
               des Knotens folgt aus der Eigenschaft content. Es gibt keine
               Processing-Instruction-Knoten fï¿½r 
               Processing-Instruction-Informationseinheiten, die Kinder der
               Dokumenttyp-Deklarations-Informationseinheit sind.
            
         
         
         
         
         
            Ein Kommentarknoten folgt aus einer
               Kommentar-Informationseinheit. Der
               Zeichenkettenwert des Knotens
               folgt aus der Eigenschaft content. Es gibt keine Kommentarknoten
               fï¿½r Kommentar-Informationseinheiten, die Kinder der
               Dokumenttyp-Deklarations-Informationseinheit sind.
            
         
         
         
         
         
            Ein Namensraumknoten folgt aus einer
               Namensraumdeklarations-Informationseinheit. Der lokale Teil des
               erweiterten Namens des
               Knotens folgt aus der Eigenschaft prefix. (Der Teil Namensraum-URI des
               erweiterten Namens des
               Knotens ist leer.) Der
               Zeichenkettenwert des Knotens
               folgt aus der Eigenschaft namespace 
                  URI.
            
            
            
            
               
                  
                     Anmerkung des ï¿½bersetzers:
                     
                     
                        Ein Namensraumknoten folgt aus einer Namensraum-Informationseinheit.
                        Der Zeichenkettenwert des 
                        Knotens folgt aus der Eigenschaft namespace name.
                        
                     
                     
                  
               
            
            
            
         
         
         
      
      
      
      
      
      
      
      
      
         
            
               
               
               Zusï¿½tzliche Referenzen der deutschen ï¿½bersetzung
               
               
               
               
                  
                  
                  XML, 2nd Edition
                  World Wide Web Consortium:
                     Extensible Markup Language (XML) 1.0 (Second Edition).
                     W3C Recommendation. Siehe http://www.edition-w3c.de/TR/2000/REC-xml-20001006.
                  
                  
                  
                  ISO/IEC 10646, 2nd Edition
                  ISO
                     (International Organization for Standardization): ISO/IEC 
                        10646-1:2000, Information technology â€” Universal Multiple-Octet Coded 
                        Character Set (UCS) â€” Part 1: Architecture and Basic Multilingual 
                        Plane, Edition: 2 (Monolingual). Internationaler Standard. Siehe
                     http://www.iso.ch/cate/d29819.html.
                  
                  
                  
                  XSLT-Konformitï¿½t
                  Oasis (Organization for the 
                     Advancement of Structured Information Standards): 
                     Oasis XSLT/XPath Conformance Subcommittee. Siehe
                     http://www.oasis-open.org/committees/xslt/.
                  
                  
                  
                  XPath Errata
                  World Wide Web Consortium:
                     XML Path Language (XPath) Version 1.0 Specification Errata.
                     29.09.2000. Siehe http://www.w3.org/1999/11/REC-xpath-19991116-errata.
                  
                  
                  
                  XPath Requirements 2.0
                  World Wide Web
                     Consortium: XPath Requirements Version 2.0.
                     W3C Working Draft. Siehe http://www.edition-w3c.de/TR/xpath20req.
                  
                  
                  
                  XPath 2.0
                  World Wide Web Consortium:
                     XML Path Language (XPath) 2.0.
                     W3C Working Draft. Siehe http://www.edition-w3c.de/TR/xpath20/.
                  
                  
                  
                  XPath Operators 2.0
                  World Wide Web Consortium:
                     XQuery 1.0 and XPath 2.0 Functions and Operators.
                     W3C Working Draft. Siehe http://www.edition-w3c.de/TR/xquery-operators/.
                  
                  
                  
                  XQuery
                  World Wide Web Consortium:
                     XQuery: A Query Language for XML. W3C Working Draft. Siehe
                     http://www.edition-w3c.de/TR/xquery.
                  
                  
                  
                  XSLT 2.0
                  World Wide Web Consortium:
                     XSL Transformations (XSLT) Version 2.0. W3C Working Draft.
                     Siehe http://www.edition-w3c.de/TR/xslt20/.

XML Path Language (XPath)Version 1.0

Deutsche, kommentierte ï¿½bersetzung

XML Path Language (XPath)Version 1.0

Empfehlung des W3C, 16. November 1999

Zusammenfassung

Status dieses Dokuments

Inhaltsverzeichnis

Anhang

1 Einleitung

2 Lokalisierungspfade

Lokalisierungspfade

2.1 Lokalisierungsschritte

Lokalisierungsschritte

2.2 Achsen

Achsen

2.3 Knotentests

2.4 Prï¿½dikate

Prï¿½dikate

2.5 Abgekï¿½rzte Syntax

Abkï¿½rzungen

3 Ausdrï¿½cke

3.1 Grundlagen

3.2 Funktionsaufrufe

3.3 Knotenmengen

3.4 Boolesche Werte

3.5 Zahlen

Numerische Ausdrï¿½cke

3.6 Zeichenketten

3.7 Lexikalische Struktur

Lexikalische Struktur von Ausdrï¿½cken

4 Bibliothek der Grundfunktionen

4.1 Funktionen auf Knotenmengen

4.2 Zeichenkettenfunktionen

4.3 Boolesche Funktionen

4.4 Zahlenfunktionen

5 Datenmodell

5.1 Wurzelknoten

5.2 Elementknoten

5.2.1 Eindeutige IDs

5.3 Attributknoten

5.4 Namensraumknoten

5.5 Processing-Instruction-Knoten

5.6 Kommentarknoten

5.7 Textknoten

6 Konformitï¿½t

A Referenzen

A.1 Normative Referenzen

A.2 Andere Referenzen

B Abbildung auf die XML-Informationsmenge (nicht normativ)

Zusï¿½tzliche Referenzen der deutschen ï¿½bersetzung

XML Path Language (XPath)
Version 1.0

XML Path Language (XPath)
Version 1.0