← retour aux snippets

pandas: dropna subset/threshold

Supprimer lignes/colonnes manquantes selon conditions.

python pandas #pandas#dropna#missing

objectif

Supprimer lignes/colonnes manquantes selon conditions.

code minimal

import pandas as pd
df = pd.DataFrame({"a":[1,None,3], "b":[None,None,2]})
print(df.dropna(subset=["a"]).shape[0])

utilisation

import pandas as pd
df = pd.DataFrame({"a":[None,1], "b":[None,2]})
print(df.dropna(thresh=1).shape[0])

variante(s) utile(s)

import pandas as pd
df = pd.DataFrame({"a":[None,1], "b":[None,2]})
print(df.dropna(axis=1, how="all").shape[1])

notes

  • thresh conserve les lignes avec au moins n valeurs non nulles.