Snippets

Du code concis, avec une explication claire.

python

sklearn: make_column_selector

Sélecteurs de colonnes par dtype/noms.

#sklearn#columnselector#preprocess
python

sklearn: ColumnTransformer + OneHotEncoder

Encoder des colonnes catégorielles et numériques.

#sklearn#onehot#columntransformer
python

cosine similarity: plus proches par cosinus

calculer similarité cosinus et récupérer les k plus proches

#similarity#cosine#neighbors
python

sklearn cross_val_predict avec probabilités

générer des prédictions out-of-fold avec predict_proba

#sklearn#cv
python

sklearn: DBSCAN basique

Clustering par densité avec eps/min_samples.

#sklearn#dbscan#clustering
python

sklearn: FeatureUnion

Concaténer des transformateurs en parallèle.

#sklearn#featureunion#pipeline
python

sklearn: GradientBoosting

Boosting d'arbres pour signaux non linéaires.

#sklearn#gradientboosting#tree
python

sklearn: GridSearchCV

Recherche exhaustive d'hyperparamètres avec CV.

#sklearn#gridsearch#tuning
python

sklearn GroupKFold et GroupShuffleSplit

validation croisée en respectant les groupes (leakage évité)

#sklearn#cv#groups
python

sklearn IterativeImputer (MICE)

imputation itérative multivariée des valeurs manquantes

#sklearn#imputation#mice
python

sklearn: joblib dump/load

Persister un modèle entraîné sur disque.

#sklearn#joblib#persistence
python

sklearn: IsolationForest anomalies

Détecter anomalies via forêts aléatoires.

#sklearn#anomaly#isolationforest