Anova, variantieanalyse in r
Gemiddelde toevoegen aan een boxplot One-way ANOVA, enkelvoudige vergelijking van variantie Post-hoc test volgens Tukey Shapira test, normaal verdeling van residuals? Levene test, homogeniteit van
Gemiddelde toevoegen aan een boxplot One-way ANOVA, enkelvoudige vergelijking van variantie Post-hoc test volgens Tukey Shapira test, normaal verdeling van residuals? Levene test, homogeniteit van
In de ranglijst open data inventory (ODIN) van Open Data Watch staat Nederlands sinds 2018 wereldwijd op de derde plek, ruim boven onze buurlanden België, Duitsland en Frankrijk. We scoren dus goed met het aanbod van open data!
Voorspelmodel voor lopende bijstand uitkeringen met een forecast horizon van 6 maanden. Het resultaat beoordelen we via steekproeven op historische data. In vakjargon noemen we deze methode cross-validation.
Een verkennende data analyse naar correlatie tussen bijstand en werkloosheidscijfers. Dit artikel start met data wrangling nodig voor downloaden, package cbsodata, en combineren tot een dataset met kerncijfers.
De kerncijfers gaan we in andere artikelen om in Python forecasting algoritmes uit te proberen.
Datavisualisatie met Seaborn combineert uitstekend met bevers. Voor statistische toetsen gebruiken we SciPy en statsmodels.
Exploratieve data analyse, afgekort met EDA, is een aanpak om data te onderzoeken op inhoudelijke kenmerken, samenhang en voorspellende (of verklarende) eigenschappen.
Met correlatie toon je een statisch verband aan. De correlatie coëfficiënt drukt de sterkte van dit verband aan.
Kunnen we de verschillende soorten bloemen onderscheiden met clusteren? We gaan hiervoor het K-means algorithme gebruiken.
python tips en voorbeelden Hier bewaar ik mijn tips, voorbeelden en aantekeningen over data analyse met Python. wrangling analyse en statistiek Visualisatie
Beschrijvende statistiek wordt aan het begin van de data analyse gebruikt om de kenmerken van een populatie of onderwerp te beschrijven.