Datawetenschap

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

Datawetenschap, vaak ook onvertaald in het Engels: data science, is een interdisciplinair onderzoeksveld met betrekking tot wetenschappelijke methoden, processen en systemen om kennis en inzichten uit data die zich in verschillende gestructureerde of ongestructureerde vormen bevinden te bestuderen en te integreren.

Datawetenschap is een concept om statistieken, data-analyse en aanverwante methoden te verenigen. Het maakt gebruik van technieken en theorieën ontleend uit vele velden binnen het brede gebied van de wiskunde, statistiek, informatiekunde en computerwetenschappen. In het bijzonder de subdomeinen van machinaal leren, classificatie, cluster-analyse, datamining, databases, en visualisatie zijn belangrijke hulpvakken.

Turing awardwinnaar Jim Gray beschouwt datawetenschap als de "vierde" paradigma van de wetenschap, naast empirie, theorievorming en computationaliteit. Hij veronderstelt dat wetenschap verandert vanwege de impact van informatietechnologie en de overvloed aan data.

Data visualization process v1.png
Logo Wikibooks
Wikibooks heeft een Engelstalig boek over dit onderwerp: Data Science: An Introduction