Pre-Caching hochdimensionaler Aggregate mit relationaler Technologie
Abstract
Die GfK Retail and Technology produziert Berichte für einige hundert Wa- rengruppen auf Basis eines zentralen Data Warehouse. Die umfassenden und detailreichen, d.h. hochdimensionalen Auswertungen schränken die Einsatzfähigkeit von materialisierten Sichten stark ein. Cache-Techniken können aufgrund kontinuierlicher Änderungen am Datenbestand ebenfalls nicht eingesetzt werden. Um Zugriffe auf die Rohdaten dennoch vermeiden zu können, wurde ein kombinierter Ansatz entwickelt. Die benötigten Aggregate werden a priori in einen Aggregat-Cache geladen. Um eine hohe Wiederverwendbarkeit und einfache Wartbarkeit zu ermöglichen, werden die Ag- gregate nach den Hauptdimensionen zerlegt abgelegt. Das Verfahren unterstützt auch die Berechnung nicht-additiver Kennzahlen. Es wurde basierend auf einem relationalen Datenbanksystem realisiert und ist produktiv im Einsatz.
Full Text: PDF