Implementierung eines effizienten datenbankbasierten SPARQL-Prozessors und Erweiterungen zu SPARQL

Authors: 
Weiske, Christian
Year: 
2007
Language: 
German
Abstract: 
Die Vision des Internets als weltumspannendes Informationsnetz ist zur Wirklichkeit geworden. Um die Idee des weltweiten Datennetzes wahr werden zu lassen, wurde das Resource Description Framework RDF entwickelt. Die dieses Netz speisenden Daten sind zu großen Teilen in Datenbanken abgelegt. Eine Abfragesprache für RDF-Daten ist die vom World Wide Web Consortium im Standardisierungsprozess befindliche SPARQL Protocol And Query Language. Die RDF API for PHP ist eine in der Skriptsprache PHP programmierte Funktionsbibliothek zum Arbeiten mit Daten im RDF-Format. Ziel dieser Arbeit ist es, eine effiziente, datenbankgestützte Implementierung von SPARQL auf Basis der RAP-Bibliothek zu schaffen. Nach den Grundlagen des semantischen Netzes werden neben SPARQL und der RDF API for PHP auch konkurrierende Bibliotheken mit SPARQL-Unterstützung vorgestellt. Der bereits existierende, speicherbasierte SPARQL Prozessor des RAP-Frameworks wird analysiert und dessen Probleme identifiziert. Im Folgenden werden die Anforderungen und die Implementierung des neuen datenbankgestützten Prozessors im Detail beschrieben. Abschließend kommt es zur Evaluation der Geschwindigkeit des neuen Prozessors im Vergleich zu anderen SPARQL-fähigen Datensystemen. Während der täglichen Arbeit mit SPARQL hat sich herausgestellt, dass sich das Protokoll aufgrund einiger Unzulänglichkeiten noch nicht vollständig für den praktischen Einsatz eignet. Aus diesem Grund werden abschließend Erweiterungen zu SPARQL vorgestellt, die sich in der Praxis als hilfreich erwiesen haben. Der im Rahmen dieser Diplomarbeit umgesetzte SPARQL Prozessor erweist sich als robust und schnell. Er liegt trotz der Umsetzung mit einer Skriptsprache in der gleichen Leistungsdimension wie andere State-of-the-Art-Implementierungen und ist diesen häufig sogar überlegen. Er wird bereits in mehreren Anwendungen produktiv eingesetzt und ist als Open-Source-Projekt einer internationalen Anwender- und Entwicklergemeinde zugänglich.
AttachmentSize
2007-4.pdf583.41 KB