Snippets
Du code concis, avec une explication claire.
spaCy NER: extraire des entités nommées
détecter personnes, organisations, lieux avec spaCy
statsmodels: OLS régression
Régression linéaire avec résumés statistiques.
scikit-learn CountVectorizer n-grammes
vectoriser du texte en sacs de mots et n-grammes
prétraitement texte: nettoyage de base
nettoyer, normaliser et tokeniser du texte pour ML
xgboost: métrique personnalisée (feval)
Définir une métrique d'évaluation custom pour xgb.train.
tsfresh: extraire des features séries temporelles
calculer automatiquement des features sur séries temporelles
xgboost: classifier avec early stopping
Entraîner un classifieur XGBoost avec jeu de validation et arrêt anticipé.
umap-learn: réduction 2D pour visualiser
projeter des vecteurs en 2D avec UMAP pour exploration
xgboost: xgb.cv et early stopping
Validation croisée intégrée avec arrêt anticipé pour choisir n_estimators.
xgboost: importance (gain) et SHAP
Comparer importance par gain et par valeurs SHAP.
ydata-profiling: rapport EDA automatique
générer un rapport exploratoire complet en une ligne
xgboost + optuna: tuning de bout en bout
Optimiser XGBClassifier avec Optuna et réentraîner au best_iteration.