Datawetenschap
Datawetenschap, vaak ook onvertaald in het Engels: data science, is een interdisciplinair onderzoeksveld met betrekking tot wetenschappelijke methoden, processen en systemen om kennis en inzichten te onttrekken uit (zowel gestructureerde als ongestructureerde) data.
Datawetenschap is een concept om statistieken, data-analyse en aanverwante methoden te verenigen. Het maakt gebruik van technieken en theorieën ontleend aan vele disciplines binnen het brede gebied van de wiskunde, statistiek, informatiekunde en computerwetenschappen. In het bijzonder de subdomeinen van machinaal leren, classificatie, cluster-analyse, datamining, databases, en visualisatie zijn belangrijke hulpvakken.
Turing awardwinnaar Jim Gray beschouwt datawetenschap als de "vierde" paradigma van de wetenschap, naast empirie, theorievorming en computationaliteit. Hij veronderstelt dat wetenschap verandert vanwege de impact van informatietechnologie en de overvloed aan data.
Stichtingen
[bewerken | brontekst bewerken]Datawetenschap is een interdisciplinair vakgebied dat zich richt op het extraheren van kennis uit datasets, die doorgaans groot zijn (zie big data), en het toepassen van de kennis en bruikbare inzichten uit data om problemen in een breed scala van toepassingsdomeinen op te lossen.[1]
Het veld omvat het voorbereiden van gegevens voor analyse, het formuleren van datawetenschapsproblemen, het analyseren van gegevens, het ontwikkelen van gegevensgestuurde oplossingen en het presenteren van bevindingen om beslissingen op hoog niveau in een breed scala van toepassingsdomeinen te informeren. Als zodanig omvat het vaardigheden uit de informatica, statistiek, informatiewetenschap, wiskunde, informatievisualisatie, gegevensintegratie, grafisch ontwerp, complexe systemen, communicatie en het bedrijfsleven.[2][3]
Statisticus Nathan Yau, gebaseerd op Ben Fry, koppelt datawetenschap ook aan interactie tussen mens en computer: gebruikers moeten intuïtief gegevens kunnen controleren en onderzoeken.[4] In 2015 identificeerde de American Statistical Association databasebeheer, statistieken en machine learning, en gedistribueerde en parallelle systemen als de drie opkomende fundamentele professionele gemeenschappen.
- Dit artikel of een eerdere versie ervan is een (gedeeltelijke) vertaling van het artikel Data science op de Engelstalige Wikipedia, dat onder de licentie Creative Commons Naamsvermelding/Gelijk delen valt. Zie de bewerkingsgeschiedenis aldaar.
- ↑ Kevin Huo (2021). Ace the Data Science Interview. ISBN 978-0578973838. Gearchiveerd op 8 mei 2023.
- ↑ (en) 1. Introduction: What Is Data Science? - Doing Data Science [Book]. www.oreilly.com. Gearchiveerd op 28 september 2020. Geraadpleegd op 3 april 2020.
- ↑ (en) the three sexy skills of data geeks. m.e.driscoll: data utopian (27 May 2009). Gearchiveerd op 22 oktober 2020. Geraadpleegd op 3 april 2020.
- ↑ ASA Statement on the Role of Statistics in Data Science. AMSTATNEWS. American Statistical Association (1 oktober 2015). Gearchiveerd op 20 June 2019. Geraadpleegd op 29 mei 2019.