CSV bestanden importeren
CSV is een veel voorkomend formaat voor het uitwisselen van datasets. Met Pandas kan je deze bestanden eenvoudig importeren.
CSV is een veel voorkomend formaat voor het uitwisselen van datasets. Met Pandas kan je deze bestanden eenvoudig importeren.
Exploratieve data analyse, afgekort met EDA, is een aanpak om data te onderzoeken op inhoudelijke kenmerken, samenhang en voorspellende (of verklarende) eigenschappen.
Kunnen we de verschillende soorten bloemen onderscheiden met clusteren? We gaan hiervoor het K-means algorithme gebruiken.
Voorspelmodel voor lopende bijstand uitkeringen met een forecast horizon van 6 maanden. Het resultaat beoordelen we via steekproeven op historische data. In vakjargon noemen we deze methode cross-validation.
Een verkennende data analyse naar correlatie tussen bijstand en werkloosheidscijfers. Dit artikel start met data wrangling nodig voor downloaden, package cbsodata, en combineren tot een dataset met kerncijfers.
De kerncijfers gaan we in andere artikelen om in Python forecasting algoritmes uit te proberen.
Datavisualisatie met Seaborn combineert uitstekend met bevers. Voor statistische toetsen gebruiken we SciPy en statsmodels.
In de ranglijst open data inventory (ODIN) van Open Data Watch staat Nederlands sinds 2018 wereldwijd op de derde plek, ruim boven onze buurlanden België, Duitsland en Frankrijk. We scoren dus goed met het aanbod van open data!
Met correlatie toon je een statisch verband aan. De correlatie coëfficiënt drukt de sterkte van dit verband aan.
Beschrijvende statistiek wordt aan het begin van de data analyse gebruikt om de kenmerken van een populatie of onderwerp te beschrijven.