objectif
Supprimer lignes/colonnes manquantes selon conditions.
code minimal
import pandas as pd
df = pd.DataFrame({"a":[1,None,3], "b":[None,None,2]})
print(df.dropna(subset=["a"]).shape[0])
utilisation
import pandas as pd
df = pd.DataFrame({"a":[None,1], "b":[None,2]})
print(df.dropna(thresh=1).shape[0])
variante(s) utile(s)
import pandas as pd
df = pd.DataFrame({"a":[None,1], "b":[None,2]})
print(df.dropna(axis=1, how="all").shape[1])
notes
threshconserve les lignes avec au moins n valeurs non nulles.