Snippets
Du code concis, avec une explication claire.
sklearn: RandomForest basique
Forêt aléatoire pour classification ou régression.
#sklearn#randomforest#tree
sklearn RobustScaler et QuantileTransformer
normaliser robuste aux outliers ou transformer vers distribution cible
#sklearn#scaling#preprocessing
sklearn: SimpleImputer
Imputer des valeurs manquantes proprement.
#sklearn#imputer#missing
sklearn SpectralClustering: graph clustering
clustering spectral basé graphe de similarité
#sklearn#clustering#spectral
sklearn StackingClassifier/Regressor
empiler plusieurs modèles avec Stacking pour de meilleures performances
#sklearn#ensemble#stacking
sklearn: SVC avec probabilités
SVM kernel RBF avec sorties probabilistes.
#sklearn#svc#svm
sklearn TruncatedSVD: réduction dimensionnelle sparse
réduire la dimension de matrices creuses (TF-IDF) avec TruncatedSVD
#sklearn#svd#sparse
sklearn: TimeSeriesSplit
Validation croisée pour séries temporelles.
#sklearn#timeseries#cv
sklearn TransformedTargetRegressor
transformer la variable cible (log, box-cox) dans un pipeline propre
#sklearn#pipeline#regression
sklearn: train_test_split (stratify)
Séparer entraînement/test avec stratification.
#sklearn#split#stratify
sklearn VotingClassifier
agréger plusieurs modèles par vote dur ou mou
#sklearn#ensemble#voting
spaCy: tokenisation, lemmas et POS
extraire tokens, lemmes et étiquettes morpho-syntaxiques avec spaCy
#spacy#nlp#pos