Snippets

Du code concis, avec une explication claire.

python

spaCy NER: extraire des entités nommées

détecter personnes, organisations, lieux avec spaCy

#spacy#ner#nlp
python

statsmodels: OLS régression

Régression linéaire avec résumés statistiques.

#statsmodels#ols#regression
python

scikit-learn CountVectorizer n-grammes

vectoriser du texte en sacs de mots et n-grammes

#sklearn#text#ngrams
python

prétraitement texte: nettoyage de base

nettoyer, normaliser et tokeniser du texte pour ML

#text#preprocessing#sklearn
python

xgboost: métrique personnalisée (feval)

Définir une métrique d'évaluation custom pour xgb.train.

#xgboost#custom-metric#evaluation
python

tsfresh: extraire des features séries temporelles

calculer automatiquement des features sur séries temporelles

#tsfresh#features#time-series
python

xgboost: classifier avec early stopping

Entraîner un classifieur XGBoost avec jeu de validation et arrêt anticipé.

#xgboost#classification#early-stopping
python

umap-learn: réduction 2D pour visualiser

projeter des vecteurs en 2D avec UMAP pour exploration

#umap#dimensionality-reduction#viz
python

xgboost: xgb.cv et early stopping

Validation croisée intégrée avec arrêt anticipé pour choisir n_estimators.

#xgboost#cv#early-stopping
python

xgboost: importance (gain) et SHAP

Comparer importance par gain et par valeurs SHAP.

#xgboost#shap#importance
python

ydata-profiling: rapport EDA automatique

générer un rapport exploratoire complet en une ligne

#profiling#eda#report
python

xgboost + optuna: tuning de bout en bout

Optimiser XGBClassifier avec Optuna et réentraîner au best_iteration.

#xgboost#optuna#tuning