Gesellschaft für Informatik e.V.

Lecture Notes in Informatics


Ausgezeichnete Informatikdissertationen 2000 D-1, 131-141 (2000).

GI, Gesellschaft für Informatik, Bonn
2000


Editors

Dorothea Wagner (ed.)


Copyright © GI, Gesellschaft für Informatik, Bonn

Contents

Qualitätsgesteuerte Anfragebearbeitung für Integrierte Informationssysteme

Felix Naumann

Abstract


Der wichtigste Beitrag dieser Dissertation ist die Integration eines Maßes für Informationsqualität mit dem Problem der Anfrageplanung. Die Notwendigkeit und Wichtigkeit von Qualitätsüberlegungen sind in der Forschung hinlänglich bekannt, werden jedoch oft ignoriert; die Integration dieser beiden Bereiche wurde bislang noch nicht vorgenommen. Wir behandeln umfassend alle Aspekte dieser Integration: beginnend mit einem allgemeinen Modell der Anfrageplanung über eine Definition von Informationsqualität und einem Modell, Werte für Qualitätskriterien zu bestimmen, über Vergleichsmethoden um die Qualitätsmaße auszuwerten, bis hin zu Algorithmen, die mit Hilfe dieser Methoden und Maße qualitativ hochwertige Ergebnisse auf Anfragen produzieren. Daten, die aus autonomen Quellen integriert werden, insbesondere aus WWW Quellen, sind von schlechter Qualität. Diskussionen mit Wissenschaftlern und Praktikern vieler Ge- biete haben gezeigt, daß niedrige Informationsqualität eines der drängendsten Probleme moderner Informationssysteme ist. Mit mehr und mehr verfügbaren Daten und mehr und mehr autonomen Quellen wird sich das Problem in Zukunft noch verschärfen. Wir hoffen, daß die Ergebnisse und Methoden dieser Arbeit Eingang in integrierte Informationssysteme finden, um so wieder die Fähigkeit zu erlangen, Nutzern auf effiziente Weise qualitativ hochwertige Daten liefern zu können. Diese Fähigkeit wurde einst verloren: beim Übergang von zentralisierten Datenbanken zu integrierten Informationssystemen. Literaturverzeichnis [Bas90] Basch, R.: Measuring the quality of the data: Report on the fourth annual SCOUG retreat. In Database Searcher, Bd. 6 (8). Qualitätsgesteuerte Anfragebearbeitung für Integrierte Informationssysteme [CZW98] Chen, Y.; Zhu, Q.; Wang, N.: Query processing with quality control in the World Wide Web. In World Wide Web, Bd. 1 (4):$(1998)$, S. 241-255. [HS98] Hernández, M. A.; Stolfo, S. J.: Real-world data is dirty: Data cleansing and the merge/purge problem. In Data Mining and Knowledge Discovery, Bd. 2 (1):$(1998)$, S. 9- 37. [JV97] Jarke, M.; Vassiliou, Y.: Data warehouse quality design: A review of the DWQ project. In Proc. of the Int. Conf. on Information Quality (IQ), 1997. [Les98] Leser, U.: Combining heterogeneous data sources through query correspondence assertions. In Workshop on Web Information and Data Management, in conjunction with CIKM'98. Washington, D.C., 1998, S. 29-32. [LN00] Leser, U.; Naumann, F.: Query planning with information quality bounds. In Proc. of the Int. Conf. on Flexible Query Answering Systems (FQAS), Advances in Soft Computing. Springer, Warsaw, Poland, 2000. [LRO96] Levy, A.; Rajaraman, A.; Ordille, J.: Query-answering algorithms for information agents. In AAAI National Conf. on Artificial Intelligence, 1996, S. 40-47. [MUV84] Maier, D.; Ullman, J. D.; Vardi, M. Y.: On the foundations of the universal relation model. In ACM Transactions on Database Systems (TODS), Bd. 9 (2):$(1984)$, S. 283- 308. [Nau98] Naumann, F.: Data fusion and data quality. In Proc. of the New Techniques \& Technologies for Statistics Seminar (NTTS). Sorrento, Italy, 1998, S. 147-154. [NF00] Naumann, F.; Freytag, J. C.: Completeness of information sources. Techn. Ber. 135, Humboldt-Universität zu Berlin, Institut für Informatik, 2000. [NFS98] Naumann, F.; Freytag, J. C.; Spiliopoulou, M.: Quality-driven source selection using Data Envelopment Analysis. In Proc. of the Int. Conf. on Information Quality (IQ). Cambridge, MA, 1998, S. 137-152. [NL99] Naumann, F.; Leser, U.: Density scores for cooperative query answering. In Proc. of the Workshop Föderierte Datenbanken. Berlin, 1999, S. 103-116. [NL00] Naumann, F.; Leser, U.: Cooperative query answering with density scores. In Proc. of the Int. Conf. on Management of Data (COMAD). Pune, India, 2000. [NLF99] Naumann, F.; Leser, U.; Freytag, J.: Quality-driven integration of heterogenous information systems. In Proc. of the Int. Conf. on Very Large Databases (VLDB). Edinburgh, 1999, S. 447-458. [NR99] Naumann, F.; Rolker, C.: Do metadata models meet IQ requirements? In Proc. of the Int. Conf. on Information Quality (IQ). Cambridge, MA, 1999, S. 99-114. [NR00] Naumann, F.; Rolker, C.: Assessment methods for information quality criteria. In Proc. of the Int. Conf. on Information Quality (IQ). Boston, MA, 2000. [Red96] Redman, T. C.: Data Quality for the Information Age. Artech House, Boston, London, 1996. [Wei99] Weikum, G.: Towards guaranteed quality and dependability of information systems. In Proc. of the Conf. Datenbanksysteme in Büro, Technik und Wissenschaft (BTW). Freiburg, Germany, 1999, S. 379-409. [Wie92] Wiederhold, G.: Mediators in the architecture of future information systems. In IEEE Computer, Bd. 25 (3):$(1992)$, S. 38-49. [WS96] Wang, R. Y.; Strong, D. M.: Beyond accuracy: What data quality means to data consumers. In Journal on Management of Information Systems, Bd. 12 (4):$(1996)$, S. 5-34. [YM98] Yu, C.; Meng, W.: Principles of database query processing for advanced applications. Morgan Kaufmann, San Francisco, CA, USA, 1998. [YNGM00] Yerneni, R.; Naumann, F.; Garcia-Molina, H.: Maximizing coverage of mediated web queries. Techn. Ber., Stanford University, CA, 2000. URL edu/ yerneni/pubs/mcmwq.ps. Felix Naumann ist geboren am 10.11.1971 in Hamburg, wo er 1990 das Abitur erlangt hat. Von 1990 an studierte er Wirtschaftsmathematik an der Technischen Universität Berlin und schloß 1997 das Studium mit einem Diplom ab. Als Mitglied des Berlin-Brandenburger Graduiertenkollegs “Verteilte Informationssysteme” forschte Fe- lix Naumann von 1997 bis 2000 am Lehrstuhl für Datenbanken und Informationssysteme bei Prof. Johann-Christoph Freytag an der Humboldt Universität zu Berlin, und promovierte in 2000. Seit 2001 ist er als Forscher am IBM Almaden Research Center in San Jose, USA beschäftigt.


Full Text: PDF

GI, Gesellschaft für Informatik, Bonn
ISBN 3-88579-405-5


Last changed 12.06.2012 13:40:24