#nlp
4 éléments
snippet
spaCy: tokenisation, lemmas et POS
extraire tokens, lemmes et étiquettes morpho-syntaxiques avec spaCy
ouvrir
snippet
spaCy NER: extraire des entités nommées
détecter personnes, organisations, lieux avec spaCy
ouvrir
snippet
sklearn: HashingVectorizer
Vectorisation stateless par hashing (peu coûteuse mémoire).
ouvrir
snippet
sklearn: TfidfVectorizer (texte)
Transformer du texte en features TF-IDF et entraîner un modèle.
ouvrir
page 1 sur 1