Gesellschaft für Informatik e.V.

Lecture Notes in Informatics


Informatik bewegt: Informatik 2002 - 32. Jahrestagung der Gesellschaft für Informatik e.v. (GI), 30. September - 3.Oktober 2002 in Dortmund. P-19, 146-150 (2002).

GI, Gesellschaft für Informatik, Bonn
2002


Editors

Sigrid E. Schubert (ed.), Bernd Reusch (ed.), Norbert Jesse (ed.)


Copyright © GI, Gesellschaft für Informatik, Bonn

Contents

BINGO! Ein thematisch fokussierender Crawler zur Generierung personalisierter Ontologien

Martin Theobald , Stefan Siersdorfer and Sergej Sizov

Abstract


Fokussierendes Crawling ist ein viel versprechender Ansatz zur Verbesserung der Ausbeute einer Expertensuche über einem spezifischen Themenbereich des Webs. Dieses Verfahren beinhaltet die automatische Klassifikation von Dokumenten in eine benutzerspezifische Hierarchie von Themen, die wir auch als Ontologie bezeichnen. Die Qualität der Trainingsdaten des Klassifikators ist der kritischste Punkt für die Ef- fektivität eines fokussierenden Crawlers. Der BINGO!-Ansatz versucht die Grenzen einer Trainingsbasis mit nur wenigen intellektuell kategorisierten Dokumenten zu überwinden und in einer automatisierten Wachstumsphase selbständig eine breite Trainingsbasis durch die Identifikation themenspezifischer ”Archetypen” zu generieren. Die anschließende Erntephase vervollständigt dann die Ontologie nach iterativem Neutrainieren des Klassifikators mit einer verbesserten Ausbeute und Präzision.


Full Text: PDF

GI, Gesellschaft für Informatik, Bonn
ISBN 3-88579-348-2


Last changed 04.10.2013 17:54:51