Performanceanalyse von SOAP- und REST- basierten Services in einer Linguistic Resources Umgebung

Authors: 
Sander, Sebastian
Year: 
2010
Language: 
German
Abstract: 
Im linguistsichen Umfeld ist die Verarbeitung von größeren Datenmengen mehrerer 1.000 MB keine Seltenheit, da hier sehr viele Textdokumente in elektronischer Form zur Verfügung stehen. Aufgrund dieses hohen Speicheraufkommens ist es nicht möglich, dass jeder Rechner die nötige Hardware bereitstellen kann, um Schriften oder Texte abzuspeichern. Außerdem benötigen diese meist nicht den gesamten Text, sondern nur einen gewissen Teil bzw. lediglich Metainformationen daraus. Daher ist es wichtig, solche Texte zentral auf einen Server zu hinterlegen und für bestimmte Client-Rechner zugänglich zu machen. Um dies zu ermöglichen, ist das Entwickeln von Service- bzw. Ressourcen-orientierten Architekturen notwendig. Diese müssen sowohl effektiv als auch effizient die durch den Client angefragten Daten zur Verfügung stellen. Daher ist eine genaue Kenntnis über die Performance von den existierenden Web Service Frameworks, der Techniken zur Verarbeitung von XML-Dokumenten und die Protokolle zur Übertragung dieser nötig um solche Architekturen zu entwickeln. In vielen Artikeln wird die Verarbeitung von XML-Dokumenten als Flaschenhals bezeichnet, da dieses sehr viel Zeit und Speicher in Anspruch nimmt. Zahlreiche Quellen, wie zum Beispiel (Sirinivas, 2006), zeigen die Performanceunterschiede zwischen SOAP und REST oder den verschiedenen Web Service Frameworks und XML-Schnittstellen. Diese untersuchen jedoch meist nur die Performance auf die Bewältigung von homogenen Elementen in einem Dokument und legen dabei nicht den Fokus auf die Verarbeitung von textbasierten Dokumenten. Im Rahmen dieser Arbeit werden zunächst die Grundlagen, die Unterschiede und die Features der beiden Service Technologien, SOAP und REST, erarbeitet. Anschließend werden die Web Service Frameworks Apache Axis 1, Apache Axis 2 und Metro 2.0 genauer betrachtet. Der letzte Teil dieser Arbeit beschäftigt sich mit der Verarbeitung von XML-Dokumenten. Hier spielen die verschiedenen Techniken, XML-Dokumente mittels DOM und StAX zu erstellen eine primäre Rolle. Dabei werden verschiedene Referenzimplementierungen der Standards sowie Frameworks betrachtet. Zusätzlich wird untersucht wie sich die Generierung von XML im Inline- und Stand Off-Markup auf die Performance auswirkt. Dazu werden die Standards der Text Encoding Initiative zur Textkodierung und -formatierung hinzugezogen. Am Schluß jedes Kapitels werden die Details zu den Durchführungen der Tests, deren Resultate und die daraus gewonnenen Schlussfolgerungen präsentiert. Dabei wird der Fokus auf die Linguistik gelegt.
AttachmentSize
Diplomarbeit.pdf945.88 KB