ISLE: Konzeption und Realisierung eines verteilten XML-basierten Informationssystems

Authors: 
Melnik, Sergey
Year: 
1999
Language: 
German
Abstract in English: 
The rapid development of XML (eXtensible Markup Language) as a new Web language provides far reaching possibilities for a flexible implementation of distributed information systems. This thesis describes the fundamental design and the experiences gained during the development of a university information system based on XML. The system allows staff members to create high-quality metadata about university resources like courses, publications etc. and make it available for a global search. The metadata is encoded in XML and is stored on the Web in a distributed fashion. CORBA-based tools are used to support creating the metadata. A crawler periodically collects the metadata and stores it on the aggregation server. The aggregation server offers an XML-based querying interface to the clients. On the clients, the information is presented using a Java module which interprets and formats data according to customized user preferences stored in XML on the client machines. Furthermore, the aggregated data is used for the automatic report generation and archival. The data model of the system is described using the Resource Description Framework (RDF). The thesis deals with advantages and problems encountered using XML and the distributed architecture. It also introduces the basic principles and techniques deployed during the development of the system.
Abstract: 
Die rasante Entwicklung von XML (eXtensible Markup Language) als neue Web-Sprache eröffnet weitreichende Möglichkeiten zur flexiblen Realisierung von verteilten Informationssystemen. Diese Diplomarbeit beschreibt den grundlegenden Aufbau und die Erfahrungen, die bei der Entwicklung eines universitären Informationssystems auf der Basis von XML gesammelt wurden. Das Resource Description Framework (RDF) wurde dabei als konzeptuelle Grundlage zur Datenmodellierung eingesetzt. Zur Manipulation von XML-Dokumenten wurde eine CORBA-basierte Schnittstelle verwendet. Durch eine zur Zeit noch kaum in der Praxis eingesetzte Technologie-Kombination konnten viele Schwierigkeiten heutiger Informationssysteme mit vergleichsweise geringem Aufwand umgangen werden. Das Datenmodell wird durch eine XML-basierte Speicherungsorganisation realisiert. Die Daten werden transparent im WWW verteilt, der Zugriff darauf erfolgt mittels des HTTP-Protokolls. Dadurch daß die in XML semantisch ausgezeichneten Informationsobjekte maschinell verarbeitet werden können, lassen sich aus dieser verteilten Datenstruktur alle benötigten Informationen extrahieren und für eine detaillierte Recherche aufbereiten. Weiterhin verfügen die Daten über einen hohen Grad der Wiederverwendbarkeit und lassen sich beispielsweise zur automatischen Generierung von Dokumenten und zur Archivierung in einer digitalen Bibliothek einsetzen. Für die Präsentation der Informationen ist ein Java-Modul zuständig, das die Interpretation und Formatierung der XML-Daten direkt vom Client-Rechner aus, entsprechend den benutzerspezifischen Präferenzen, ermöglicht, die ebenfalls in Form einer XML-Datei im lokalen Dateisystem des Nutzers gespeichert werden können. Durch die Verlagerung der Datenmanipulierung auf den Client wird die Server-Last minimiert. Ein ebenfalls in Java realisierter Server für XML-Dokumente ermöglicht die Client-basierte Bearbeitung von Dokumenten über eine CORBA-Schnittstelle. Mehrere Benutzer mit unterschiedlichen Zugriffsrechten können somit gemeinsam XML-Dokumente durch ein Web-Browser-Interface editieren. Die Diplomarbeit geht darauf ein, welche Vorteile und Probleme die Verwendung von XML und der verteilten Architektur aufgeworfen hat, und stellt die grundlegenden Prinzipien und Techniken vor, die dabei eingesetzt wurden.
Pubdate / Erscheinungsdatum: 
1999-03-25
Pages / Seitenanzahl: 
157
AttachmentSize
1999-4.pdf2.17 MB