← retour aux snippets

pandas: shift (features de lag)

Créer des colonnes retardées pour séries temporelles.

python timeseries #pandas#shift#features

objectif

Créer des colonnes retardées pour séries temporelles.

code minimal

import pandas as pd
s = pd.Series([1,2,3])
print(s.shift(1).isna().sum())

utilisation

import pandas as pd
df = pd.DataFrame({"y":[1,2,3]})
print(df.assign(lag1=lambda d: d["y"].shift(1)).shape[1])

variante(s) utile(s)

import pandas as pd
s = pd.Series([1,2,3])
print(s.diff().tolist()[1])

notes

  • Combiner shift/diff pour dériver vitesses et accélérations.