← retour aux snippets

sklearn: TimeSeriesSplit

Validation croisée pour séries temporelles.

objectif

Validation croisée pour séries temporelles.

code minimal

from sklearn.model_selection import TimeSeriesSplit
import numpy as np
X = np.arange(10).reshape(-1,1); y = np.arange(10)
tscv = TimeSeriesSplit(n_splits=3)
splits = list(tscv.split(X))
print(len(splits) == 3)

utilisation

from sklearn.model_selection import TimeSeriesSplit
tscv = TimeSeriesSplit(test_size=2, n_splits=2)
print(callable(getattr(tscv, "split")))

variante(s) utile(s)

from sklearn.linear_model import LinearRegression
print(hasattr(LinearRegression(), "fit"))

notes

  • Respecter la temporalité: pas de mélange train/test dans le passé.