TSV (Tab-Separated Values)
TSV (Tab-Separated Values) est un format texte brut similaire au CSV mais utilisant des tabulations au lieu de virgules pour séparer les valeurs. Cela évite les conflits avec les virgules dans les données, rendant l'analyse plus simple pour de nombreux cas d'utilisation.
Type MIME
text/tab-separated-values
Type
Texte
Compression
Sans perte
Avantages
- + Simpler parsing than CSV — no quoting rules needed
- + Tabs rarely appear in data, reducing ambiguity
- + Standard in bioinformatics and scientific data pipelines
Inconvénients
- − Less universally recognized than CSV in business tools
- − Cannot represent values containing tab characters
- − Some spreadsheet tools default to CSV, not TSV
Quand utiliser .TSV
Utilisez TSV lorsque les données contiennent des virgules (données scientifiques, texte en langage naturel), pour les échanges de données bio-informatiques ou lorsqu'une analyse simple est prioritaire.
Détails techniques
TSV utilise les caractères de tabulation (U+0009) comme délimiteurs et les sauts de ligne comme séparateurs d'enregistrements. Plus simple que CSV — pas de règles de guillemets car les tabulations apparaissent rarement dans les données. Le type MIME est text/tab-separated-values.
Historique
Les fichiers délimités par des tabulations ont été utilisés dès les premiers systèmes Unix et mainframe. Le format TSV est resté populaire dans les communautés bio-informatique et scientifique, où les valeurs de données contiennent souvent des virgules.