The Basics of Complex Correspondences and Functions and their Implementation and Semi-automatic Detection in COMA++.

Authors: 
Arnold, Patrick
Year: 
2011
Language: 
English
Abstract in English: 
This Master's thesis describes how a classic schema matcher is enhanced to a sophisticated schema mapper that allows complex correspondences (many-to-many-correspondences) and general functions between two schemas, as well as their semi-automatic detection in addition to the classic (1:1)-correspondence detection. With the latter aspect, this thesis is dedicated to a field in data integration, which has hardly been investigated yet, and offers an approach valuable for many schema matchers. For this purpose, the first part of this study will explain precisely what complex correspondences and functions in the context of schema matching are, how they are connected among each other, what different types exist, under which circumstances they become necessary, and how they are used in real-word scenarios. Throughout the entire first part, examples will be given to underline the meaning and importance of complex correspondences and functions. Besides this, studies and existing solutions about complex correspondences and functions, as well as their detection, will be introduced. In the second part, the actual implementation will be the center of interest, starting with the general extension of the schema matcher COMA++ to represent functions and complex correspondences, and afterwards concentrating especially on the semi-automatic detection of the aforementioned, which plays a key-role in this thesis. At the end, an evaluation will be given to point out the difficulties and benefits of the enhancement, as well as a prospect for future work.
Abstract: 
In der vorliegenden Masterarbeit wird erläutert, wie ein klassischer Schema Matcher erweitert wird, um Komplexe Korrespondenzen (many-to-many-Korrespondenzen) und allgemeine Funktionen zwischen zwei Schemata auszudrücken, sowie deren automatische Entdeckung als Erweiterung der herkömmlichen Entdeckung von (1:1)-Korrespondenzen. Der letzte Punkt widmet sich dabei einem Gebiet der Datenintegration, das bisher kaum untersucht wurde, und es werden Ansätze vorgestellt, die für viele Schema Matcher eine Bereicherung darstellen können. Zu diesem Zweck werden im ersten Teil der Arbeit Komplexe Korrespondenzen und Funktionen im Bereich des Schema Mappings ausführlich vorgestellt. Es wird gezeigt, wie diese miteinander zusammenhängen, welche Arten unterschieden werden können, unter welchen Bedingungen sie notwendig sind, und wie sie in der Praxis verwendet werden. Im gesamten ersten Teil werden Beispiele gegeben, welche die Bedeutung von Komplexen Korrespondenzen und Funktionen untermauern. Daneben werden Arbeiten und bereits vorhandene Programme vorgestellt, die sich mit Komplexen Korrespondenzen und Funktionen, sowie deren Entdeckung, befassen. Im zweiten Teil steht die eigentliche Implementierung im Mittelpunkt. Zunächst wird dabei die Erweiterung des Schema Matchers COMA++ erläutert, so dass Komplexe Korrespondenzen und Funktionen ausgedrückt werden können. Im Anschluss daran wird das semi-automatische Aufspüren von Komplexen Korrespondenzen und Funktionen beschrieben, was eine Schlüsselrolle in der vorliegenden Arbeit einnimmt. Die Arbeit schließt mit einer Auswertung der implementierten Strategien, welche die Schwierigkeiten und Vorzüge der Erweiterung verdeutlichen sollen, sowie einem Ausblick für zukünftige Arbeiten.
AttachmentSize
master_thesis.pdf968.13 KB