#text
10 éléments
snippet
fileinput: édition en place avec sauvegarde
Remplacer du texte dans un fichier en créant un .bak automatiquement.
ouvrir
snippet
NLTK: stopwords et stemming
filtrer stopwords et appliquer stemming sur du texte
ouvrir
snippet
scikit-learn CountVectorizer n-grammes
vectoriser du texte en sacs de mots et n-grammes
ouvrir
snippet
prétraitement texte: nettoyage de base
nettoyer, normaliser et tokeniser du texte pour ML
ouvrir
snippet
sklearn: MultinomialNB (texte)
Naive Bayes multinomial pour comptages (bag-of-words).
ouvrir
snippet
paste: fusionner des colonnes de fichiers texte
Assembler des fichiers ligne à ligne en colonnes, avec séparateurs personnalisés.
ouvrir
snippet
awk: extraire et agréger des colonnes
Extraire des champs, filtrer et agréger des lignes (compte, somme, moyenne) rapidement avec awk.
ouvrir
snippet
bash: lire un fichier ligne par ligne sans pièges
Lire chaque ligne exactement telle qu'écrite (espaces, backslashes) sans subshell ni pertes.
ouvrir
snippet
normaliser fins de ligne crlf vers lf
Convertir CRLF en LF et supprimer le BOM UTF-8 de façon portable, en masse et sans casser les binaires.
ouvrir
leçon
awk
pattern { action }, champs, FS/OFS, agrégations
ouvrir
page 1 sur 1