python voorbeeld

Dataframe filteren met loc

DataFrame.loc is label gebaseerd. Kolommen geef je met hun kolomnaam. Gebruik DataFrame.loc om kolommen aan te geven op basis van hun positie.

# Lege waarden in 'age'
df.loc[df['age'].isnull()]
# Zonder lege waarden in 'age'
df.loc[df['age'].isnull() == False]
# Alle records met lege waarden
df.loc[df.isnull().any(axis=1)]
# Komt voor in lijst
df.loc[df['embark_town'].isin(['Southampton', 'Cherbourg'])]
# Text begint met of bevat
df.loc[df['embark_town'].str.endswith('ton')
       | df['embark_town'].str.contains('bour')]
# Criteria combineren
# Plaats () rond elke conditie
df.loc[(df['embark_town'].isin(['Southampton', 'Cherbourg']))
       & (df['age'] > 10)]
# Criteria opslaan in een variabele
mask = (df['embark_town'].isin(['Southampton', 'Cherbourg'
                                ])) & (df['age'] > 10)
df.loc[mask]
# Criteria combineren
df.loc[mask & df['deck'].isnull()]
# Alle records die NIET voldoen
mask = df['sex'] == 'male'
df.loc[~mask]
# Kolommen selecteren
df.loc[mask, ['age', 'sex']]
# Kolommen selecteren zonder criteria
df.loc[:, ['age', 'sex']]

data als grondstof

Data gedreven

Verkennende onderzoeken, segmenteren, samenhang, verklarende analyses en/of toepassen van algoritmes
Lees verder