Big data

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

Men spreekt van big data wanneer men werkt met een of meer datasets die te groot zijn om met reguliere databasemanagementsystemen onderhouden te worden. De definitie van big data is niet altijd duidelijk. Volgens Gartner gaat het in elk geval om drie factoren: de hoeveelheid data, de snelheid waarmee de data binnenkomen en opgevraagd worden, en de diversiteit van de data. Daarnaast speelt ook de mogelijkheid tot statistische analyse een belangrijke rol.

Toepassingen[bewerken]

  • De Large Hadron Collider heeft 150 miljoen sensoren, die samen zo'n 40 miljoen metingen per seconde doen. Het verwerken van deze grote hoeveelheid metingen en het trekken van conclusies daaruit vereisen veel rekenkracht.
  • Het Amerikaanse bedrijf Walmart verwerkt meer dan een miljoen transacties per uur, die op een slimme manier in databases opgeslagen moeten worden. Uit deze grote berg gegevens kunnen verbanden tussen verschillende producten gedestilleerd worden (bijvoorbeeld hamburgers en broodjes, maar vaak zijn de verbanden minder voor de hand liggend). Ook kunnen op basis van aankoopgedrag klanten ingedeeld worden op basis van diverse kenmerken. Door geavanceerde statistische analyses uit te voeren kan Walmart niet alleen vrij nauwkeurig inschatten wat het geslacht, inkomen, de sociale klasse en de gezinssituatie van een klant is maar kunnen ook levensgebeurtenissen zoals huwelijk, geboorte, echtscheiding en overlijden met vrij grote precisie gedetecteerd worden aan de hand van veranderingen in aankoopgedrag.
  • Big data: de Shell search is de titel van een Nederlandse tv-documentaire, een experiment in onderzoeksjournalistiek uit 2013, over hoe het doorzoeken van big data journalistiek nieuws kan opleveren over de handel en wandel van een multinational.[1]

Zie ook[bewerken]

Bronnen, noten en/of referenties