Cube (informatica)

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken
OLAP Cube

Een OLAP cube (voor online analytical processing), of gegevenskubus, is een datastructuur die snelle data-analyse mogelijk maakt.[1] Hierbij kan men data analyseren en manipuleren vanuit verschillende perspectieven. De samenstelling van data in cubes lost een aantal beperkingen op van relationele databases.[2]

Achtergrond[bewerken]

OLAP-kubussen kunnen gezien worden als uitbreidingen van de twee-dimensionale array van een spreadsheet. Zo zou een bedrijf sommige financiële gegevens willen analyseren per product, per tijdvak, per plaats, per soort van de inkomsten en kosten en door het vergelijken van actuele gegevens met een budget. Deze aanvullende methoden voor het analyseren van gegevens worden dan beschouwd als dimensies.[3] Omdat er meer dan drie dimensies in een OLAP-systeem kunnen zijn wordt soms de term hyperkubus gebruikt.

Functionaliteit[bewerken]

De OLAP-kubus bestaat uit genummerde feiten, measures genoemd, die gecategoriseerd worden door dimensies. De kubus metadata (structuur) kan gemaakt worden uit een ster-schema or sneeuwvlok schema van tabellen in een relationele database. Measures worden afgeleid uit de records in de fact tabel en dimensies worden afgeleid uit de dimensie tabellen.

Pivot[bewerken]

Een financieel analist zou de gegevens op verschillende manieren willen bekijken, bijvoorbeeld: tonen van gemeentes verticaal op een pagina en de producten horizontaal op de pagina. Dit zou kunnen voor een specifieke periode, versie en soort van uitgave. Eenmaal wanneer hij de data gezien heeft op deze manier, zou hij deze data op een andere manier wensen te bekijken. De kubus kan dan worden gedraaid zo dat de getoonde data nu periodes verticaal en kosttype horizontaal staan. Omdat zulke herorientatie het opnieuw samenstellen omvat van grote hoeveelheden data, moet deze nieuwe dataview efficient worden gegenereerd om zo geen kostbare tijd te verliezen, i.e. in seconden, in plaats van uren dan een conventionele report-writer zou in beslag nemen.[4]

Hiërarchie[bewerken]

Elk van de elementen van een dimensie kunnen samengevat worden met behulp van een hiërarchie.[5] De hiërarchie is een serie van parent-child relaties, waar een ouder lid de consolidatie weergeeft van haar onderliggende kinderen. Ouders kunnen verder worden samengevoegd als kinderen van een andere ouder.[6]

Bijvoorbeeld mei 2005 kan worden samengevat in tweede kwartaal 2005, dat op zijn beurt zou worden samengevat in het jaar 2005. Ook de steden kunnen worden samengevat in regio's, landen en vervolgens mondiale regio's; producten kunnen worden samengevat in grotere categorieën, en de kostposten kunnen worden gegroepeerd in soorten uitgaven. Omgekeerd kan de analist beginnen op een zeer algemeen niveau, zoals het totale verschil tussen de werkelijke resultaten en de begroting, en drill-down in de kubus te ontdekken welke locaties, producten en de periodes het verschil produceren.

Referenties[bewerken]

  1. Codd E.F., Codd S.B., and Salley C.T.. Providing OLAP (On-line Analytical Processing) to User-Analysts: An IT Mandate. Codd & Date, Inc (1993)
  2. Hari Mailvaganam. Introduction to OLAP - Slice, Dice and Drill. DWreview (2007) Geraadpleegd op 27 maart 2013
  3. Cybertec releases OLAP cubes for PostgreSQL. PostgreSQL (2006-10-02) Geraadpleegd op 27 maart 2013
  4. Computer Encyclopedia: multidimensional views. Answers.com Geraadpleegd op 27 maart 2013
  5. Oracle9i Data Warehousing Guide hierarchy. Lorentz Center
  6. OLAP and OLAP Server Definitions. The OLAP Council (1995) Geraadpleegd op 27 maart 2013

Externe link[bewerken]