variantieanalyse blog | Exploratieve data analyse

Anova, variantieanalyse in r

Gemiddelde toevoegen aan een boxplot One-way ANOVA, enkelvoudige vergelijking van variantie Post-hoc test volgens Tukey Shapira test, normaal verdeling van residuals? Levene test, homogeniteit van

Lees verder »

Populair

CBS Open data downloaden voor data analyse in R

In de ranglijst open data inventory (ODIN) van Open Data Watch staat Nederlands sinds 2018 wereldwijd op de derde plek, ruim boven onze buurlanden België, Duitsland en Frankrijk. We scoren dus goed met het aanbod van open data!

Lees verder »

Forecasting in Python met Prophet

Voorspelmodel voor lopende bijstand uitkeringen met een forecast horizon van 6 maanden. Het resultaat beoordelen we via steekproeven op historische data. In vakjargon noemen we deze methode cross-validation.

Lees verder »

CBS open data gebruiken voor data analyse met Python

Een verkennende data analyse naar correlatie tussen bijstand en werkloosheidscijfers. Dit artikel start met data wrangling nodig voor downloaden, package cbsodata, en combineren tot een dataset met kerncijfers.

De kerncijfers gaan we in andere artikelen om in Python forecasting algoritmes uit te proberen.

Lees verder »

Kunnen bevers ons helpen met statistiek in Python?

Datavisualisatie met Seaborn combineert uitstekend met bevers. Voor statistische toetsen gebruiken we SciPy en statsmodels.

Lees verder »

Exploratieve data analyse (EDA), wat is dat?

Exploratieve data analyse, afgekort met EDA, is een aanpak om data te onderzoeken op inhoudelijke kenmerken, samenhang en voorspellende (of verklarende) eigenschappen.

Lees verder »

Correlatie, samenhang van variabelen in R

Met correlatie toon je een statisch verband aan. De correlatie coëfficiënt drukt de sterkte van dit verband aan.

Lees verder »

Bloemsoorten onderscheiden met K-means in R

Kunnen we de verschillende soorten bloemen onderscheiden met clusteren? We gaan hiervoor het K-means algorithme gebruiken.

Lees verder »

Python tips

python tips en voorbeelden Hier bewaar ik mijn tips, voorbeelden en aantekeningen over data analyse met Python. wrangling analyse en statistiek Visualisatie

Lees verder »

Beschrijvende statistiek

Beschrijvende statistiek wordt aan het begin van de data analyse gebruikt om de kenmerken van een populatie of onderwerp te beschrijven.

Lees verder »

Tag: variantieanalyse

Populair