Klassifikation von Dokumenten mit statistischen und regelbasierten Verfahren

Authors: 
Seharsch, Andre'
Year: 
1998
Language: 
German
Abstract: 
Das Ziel dieser Arbeit ist die Entwicklung eines Indexierungssytems zur eindeutigen Klassifikation von Dokumenten anhand einer vorgegebenen Zahl von Klassen. Die Grundlage zum Aufbau des Klassifikationssystems bilden allgemeine Indexierungsysteme für Dokumente. Diese allgemeinen Systeme werden für die Klassifikation modifiziert, um die Verarbeitung der Dokumente zu beschleunigen und die Klassifikationsergebnisse zu präzisieren. Diese optimierten Methoden zur Indexierung sowie der kombinierte Einsatz von statistischen und regelbasierten Verfahren zur Bewertung von Dokumenten bilden die Basis des Klassifikationssystems. Zudem werden spezielle Techniken zur eindeutigen Klassifikation von Dokumenten erarbeitet, wobei besonderes Augenmerk auf die Transparenz des Klassifikationsprozesses für den Benutzer des Systems gelegt wurde. Die positiven Ergebnisse, die erste Tests des Klassifikationssystems am Beispiel von Kundenbriefen eines Versicherungsunternehmens lieferten, rechtfertigen seine Erprobung in der Praxis. Der Vorteil des Systems liegt in der großen Geschwindigkeit für die Verarbeitung von Dokumenten bei gleichzeitig hoher Genauigkeit der erzielten Ergebnisse. Die Möglichkeit zur Erweiterung der Datenbasis für das System verspricht ferner einen wachsenden Umfang von klassifizierbaren Dokumenten.
Pubdate / Erscheinungsdatum: 
1998-12-16
Pages / Seitenanzahl: 
79
AttachmentSize
1998-29.pdf307.87 KB