Snippets
Du code concis, avec une explication claire.
sklearn: make_column_selector
Sélecteurs de colonnes par dtype/noms.
#sklearn#columnselector#preprocess
sklearn: ColumnTransformer + OneHotEncoder
Encoder des colonnes catégorielles et numériques.
#sklearn#onehot#columntransformer
cosine similarity: plus proches par cosinus
calculer similarité cosinus et récupérer les k plus proches
#similarity#cosine#neighbors
sklearn cross_val_predict avec probabilités
générer des prédictions out-of-fold avec predict_proba
#sklearn#cv
sklearn: DBSCAN basique
Clustering par densité avec eps/min_samples.
#sklearn#dbscan#clustering
sklearn: FeatureUnion
Concaténer des transformateurs en parallèle.
#sklearn#featureunion#pipeline
sklearn: GradientBoosting
Boosting d'arbres pour signaux non linéaires.
#sklearn#gradientboosting#tree
sklearn: GridSearchCV
Recherche exhaustive d'hyperparamètres avec CV.
#sklearn#gridsearch#tuning
sklearn GroupKFold et GroupShuffleSplit
validation croisée en respectant les groupes (leakage évité)
#sklearn#cv#groups
sklearn IterativeImputer (MICE)
imputation itérative multivariée des valeurs manquantes
#sklearn#imputation#mice
sklearn: joblib dump/load
Persister un modèle entraîné sur disque.
#sklearn#joblib#persistence
sklearn: IsolationForest anomalies
Détecter anomalies via forêts aléatoires.
#sklearn#anomaly#isolationforest