Preprocessing für das Matchen von Produktangeboten

Authors: 
Thomas, Stefan
Year: 
2010
Language: 
German
Abstract: 
Digital gespeicherte Daten erfreuen sich einer stetig steigenden Verwendung. Eine manuelle Konsolidierung dieser Daten ist im kommerziellen Bereich aus Kostenund Zeitgründen praktisch nicht mehr durchführbar. Ein Verzicht auf Dublettenerkennung ist aber ebenso wenig eine Alternative. Es existieren bereits viele Ansätze um Objekt-Matching voll- bzw. zumindest semi-automatisch durchzuführen, aber insbesondere Datenbasen, welche aus Webdaten gewonnen werden, weisen eine derart hohe Heterogenität auf, dass bestehende Ansätze an ihre Grenzen stoßen. Insbesondere Produkt-Matching ist hiervon betroffen. Um Produkt-Matching-Verfahren zu unterstützen, werden hier Möglichkeiten der Vorverarbeitung vorgestellt. Es wird speziell eine Strategie entwickelt, mit der es möglich ist, gezielt Produktcodes in Textattributen zu erkennen und zu extrahieren. Diese und weitere Strategien wurden implementiert und in das bestehende Framework des WDI-Lab integriert.
Pubdate / Erscheinungsdatum: 
2010-09-24
Pages / Seitenanzahl: 
64
AttachmentSize
Bachelorarbeit_final.pdf679.3 KB