Cube (informatica)

Uit Wikipedia, de vrije encyclopedie
OLAP Cube

Een OLAP cube (voor online analytical processing), of gegevenskubus, is een datastructuur die snelle data-analyse mogelijk maakt.[1] Hierbij kan men data analyseren en manipuleren vanuit verschillende perspectieven. De samenstelling van data in cubes lost een aantal beperkingen op van relationele databases.[2]

Achtergrond[bewerken | brontekst bewerken]

OLAP-kubussen kunnen gezien worden als uitbreidingen van de twee-dimensionale array van een spreadsheet. Zo zou een bedrijf sommige financiële gegevens willen analyseren per product, per tijdvak, per plaats, per soort van de inkomsten en kosten en door het vergelijken van actuele gegevens met een budget. Deze aanvullende methoden voor het analyseren van gegevens worden dan beschouwd als dimensies.[3] Omdat er meer dan drie dimensies in een OLAP-systeem kunnen zijn, wordt soms de term hyperkubus gebruikt.

Functionaliteit[bewerken | brontekst bewerken]

De OLAP-kubus bestaat uit genummerde feiten, measures genoemd, die gecategoriseerd worden door dimensies. De kubus metadata (structuur) kan gemaakt worden uit een ster-schema of sneeuwvlok-schema van tabellen in een relationele database. Measures worden afgeleid uit de records in de feitentabel en dimensies worden afgeleid uit de dimensietabellen.

Pivot[bewerken | brontekst bewerken]

Een financieel analist zou de gegevens op verschillende manieren willen bekijken, bijvoorbeeld: tonen van gemeentes verticaal op een pagina en de producten horizontaal op de pagina. Dit zou kunnen voor een specifieke periode, versie en soort van uitgave. Eenmaal wanneer hij de data gezien heeft op deze manier, zou hij deze data op een andere manier wensen te bekijken. De kubus kan dan worden gedraaid zo dat de getoonde data nu periodes verticaal en kosttype horizontaal staan. Omdat dergelijke herorientatie het opnieuw samenstellen betekent van grote hoeveelheden data, moet deze nieuwe dataview efficient worden gegenereerd om zo geen kostbare tijd te verliezen, i.e. in seconden, in plaats van uren die een conventionele report-writer in beslag zou nemen.[4]

Hiërarchie[bewerken | brontekst bewerken]

Elk van de elementen van een dimensie kunnen samengevat worden met behulp van een hiërarchie.[5] De hiërarchie is een serie van parent-child relaties, waar een ouder lid de consolidatie weergeeft van haar onderliggende kinderen. Ouders kunnen verder worden samengevoegd als kinderen van een andere ouder.[6]

Bijvoorbeeld mei 2005 kan worden samengevat in tweede kwartaal 2005, dat op zijn beurt zou worden samengevat in het jaar 2005. Ook de steden kunnen worden samengevat in regio's, landen en vervolgens mondiale regio's; producten kunnen worden samengevat in grotere categorieën, en de kostposten kunnen worden gegroepeerd in soorten uitgaven. Omgekeerd kan de analist beginnen op een zeer algemeen niveau, zoals het totale verschil tussen de werkelijke resultaten en de begroting, en drill-down in de kubus te ontdekken welke locaties, producten en de periodes het verschil produceren.

Referenties[bewerken | brontekst bewerken]

  1. Codd E.F., Codd S.B., and Salley C.T., Providing OLAP (On-line Analytical Processing) to User-Analysts: An IT Mandate. Codd & Date, Inc (1993). Gearchiveerd op 24 januari 2009.
  2. Hari Mailvaganam, Introduction to OLAP - Slice, Dice and Drill. DWreview (2007). Gearchiveerd op 6 juli 2013. Geraadpleegd op 27 maart 2013.
  3. Cybertec releases OLAP cubes for PostgreSQL. PostgreSQL (2 oktober 2006). Geraadpleegd op 27 maart 2013.
  4. Computer Encyclopedia: multidimensional views. Answers.com. Geraadpleegd op 27 maart 2013.
  5. Oracle9i Data Warehousing Guide hierarchy. Lorentz Center. Gearchiveerd op 19 november 2010.
  6. OLAP and OLAP Server Definitions. The OLAP Council (1995). Geraadpleegd op 27 maart 2013.

Externe link[bewerken | brontekst bewerken]