← retour aux snippets

tr: nettoyer caractères invisibles et mapper

Supprimer ou remplacer tabulations, CR, contrôle ASCII; normaliser un flux.

bash text #tr#cleanup#ascii

objectif

Sanitiser des fichiers avant import (ETL) en retirant les caractères indésirables.

code minimal

# retirer CR et contrôler ASCII non imprimables
tr -d '\r' < input.txt | tr -c '\11\12\40-\176' '?' > clean.txt

utilisation

# compresser les espaces multiples en un seul
tr -s ' ' < input.txt > compact.txt

variante(s) utile(s)

# mapper en minuscules
tr '[:upper:]' '[:lower:]' < input.txt > lower.txt

notes

  • utilisez des classes POSIX [:class:] pour la portabilité.
  • attention à l’UTF-8 multioctets (tr opère par octet).