Konzeption und Implementierung einer semantischen Suchmaschine für Topic Maps

Authors: 
Windisch, Sven
Year: 
2010
Language: 
German
Abstract: 
In den vergangenen Jahren hat die Topic-Maps-Technologie eine zunehmende Bedeutung unter den Datenintegrationstechnologien gewonnen. Für die direkte Abfrage von Informationen aus einer Topic Map existiert mit der Topic-Maps-Abfragesprache TMQL ein mächtiges Werkzeug. Um diese nutzen zu können, muss der Benutzer jedoch sowohl über Kenntnisse der Abfragesprache verfügen als auch das Schema der Topic Map kennen. Deshalb wird eine Suchmaschine benötigt, mit der auch unerfahrene Benutzer die Topic-Maps-Datenbasis durchsuchen können. Nach einer Einführung in die relevanten Topic-Maps-Grundlagen werden zunächst verschiedene auf Topic-Maps-Daten spezialisierte Indexierungsalgorithmen untersucht. Einen Spezialfall stellt dabei die Indexierung virtuell zusammengeführter Topic Maps dar. Zu diesem Problem werden verschiedene Lösungsmöglichkeiten untersucht. Auf Basis der Suchmaschinenbibliothek Lucene wird eine semantische Suchmaschine entwickelt, welche die Topic-Maps-immanenten Elemente mit expliziter als auch mit impliziter Bedeutung sowohl bei der Indexierung als auch bei der Gewichtung der Suchergebnisse nutzt. Darüber hinaus wird ein allgemeines Modell zur Beschreibung von Topic-Maps-basierten Facetten vorgestellt. Darauf aufbauend werden Möglichkeiten der Erstellung generischer Facetten untersucht. Weiterhin wird mit Hilfe der Topic-Maps-Abfragesprache TMQL eine Methode zur Definition von domänen-spezifischen Facetten entworfen und erläutert. Mit der prototypischen Implementierung einer Schnittstelle, mit der die entstandene Suchmaschine in Topic-Maps-basierten Webapplikationen genutzt werden kann, wird die einfache Integration der entwickelten Suchmaschine in bestehende Web-Applikationen demonstriert. Dies wird durch die Schaffung eines neuen Pakets für die Middleware RTM ermöglicht.
AttachmentSize
thesis.pdf958.69 KB