objectif
Sanitiser des fichiers avant import (ETL) en retirant les caractères indésirables.
code minimal
# retirer CR et contrôler ASCII non imprimables
tr -d '\r' < input.txt | tr -c '\11\12\40-\176' '?' > clean.txt
utilisation
# compresser les espaces multiples en un seul
tr -s ' ' < input.txt > compact.txt
variante(s) utile(s)
# mapper en minuscules
tr '[:upper:]' '[:lower:]' < input.txt > lower.txt
notes
- utilisez des classes POSIX
[:class:]pour la portabilité. - attention à l’UTF-8 multioctets (tr opère par octet).