← retour aux snippets

pandas: valeurs manquantes et imputation

Repérer et imputer des NaN avec fillna/interpolate.

python pandas #pandas#nan#impute

objectif

Repérer et imputer des NaN avec fillna/interpolate.

code minimal

import pandas as pd
import numpy as np

s = pd.Series([1.0, np.nan, 3.0])
print(s.fillna(s.mean()).tolist())

utilisation

import pandas as pd
import numpy as np

s = pd.Series([0.0, np.nan, 2.0, np.nan, 4.0])
print(s.interpolate(method="linear").round(2).tolist())

variante(s) utile(s)

import pandas as pd

df = pd.DataFrame({"a":[1,None,3], "b":[None,2,3]})
print(df.fillna({"a":0,"b":df["b"].median()}).to_dict(orient="records"))

notes

  • Toujours vérifier l’impact sur les distributions après imputation.