Format
Sommaire
Définition
En informatique, un format de données est la façon dont est représenté (codé) un type de données, sous forme d'une suite de bits. Par commodité, on interprète cette suite de bits comme un nombre binaire, et on dit par raccourci que la donnée est représentée comme un nombre. Par exemple, le caractère C est généralement codé comme une suite dont 3 bits sont activés, ce que l'on écrit 0100 0011, soit 67 en décimal. Un format de données est ainsi une convention (éventuellement normalisée) utilisée pour représenter des données — des informations représentant un texte, une page, une image, un son, un fichier exécutable, etc. Lorsque ces données sont stockées dans un fichier, on parle de format de fichiers. Une telle convention permet d'échanger des données entre divers programmes informatiques ou logiciels, soit par une connexion directe, soit par l'intermédiaire d'un fichier. On appelle interopérabilité cette possibilité d'échanger des données entre différents logiciels. Un format, c’est quelque chose qui met en forme d’une manière conventionnelle des données destinées à représenter du texte, du son, de l’image, de la vidéo, ou une combinaison des quatre. C’est une sorte de « gabarit » qui met certaines données à des endroits déterminés. Les outils qui vont traiter ce format s’attendent à trouver tel élément à tel endroit, organisé de telle manière, et tel autre à un autre endroit, organisé d’une autre façon.
Liste de formats
Liste des principaux formats ouverts[1]
Un format ouvert (aussi appelé standard ouvert, format ouvert, format libre, ou spécification ouverte) est défini comme « tout protocole de communication, d'interconnexion ou d'échange et tout format de données interopérable et dont les spécifications techniques sont publiques et sans restriction d'accès ni de mise en œuvre »[2].
Documents
- Texte brut : ASCII (.txt) / sans extension
- Texte formaté : TeX (.tex), AbiWord (.abw), OpenDocument Text (.odt), Hypertext Markup Language (.htm ou .html), XHTML (.xhtml), Feuilles de style en cascade (.css)
- Tableur : OpenDocument Spreadsheet (.ods)
- Enregistrements biomédicaux : European Data Format (.edf)
- Document imprimable : Document PDF (.pdf)
- Livre numérique : EPUB (.epub)
Données
- Données brutes : CSV (.csv) / sans extension, JSON (.json), XML (.xml)
- Données sémantiques : RDF (.rdf)
- Données géographiques : KML (.kml), SHP (.shp)
Images
- Image simple : PNG (.png), APNG (.png), Portable pixmap (.pbm, .pbm, .pgm, .pnm), MNG (.mng), Windows bitmap (.bmp), PGF (.pgf), WebP (.webp), GIF10 (.gif), Digital *Negative (.dng)
- Fichier graphique : OpenDocument Drawing (.odg), SVG (.svg), XCF (.xcf)
3D
- OBJ
- X3D
- Le format de conteneur pour le logiciel Blender (.blend).
- Le Collada, norme de format définit par le Kronos Group.
- Alembic [archive], framework pour l'échange de données 3D.
- DAO / CAO[modifier | modifier le code]
- Drawing eXchange Format (.dxf)
Multimedia
- Vidéo : Theora (.ogg .ogv), Dirac, VP8
- Audio : Ogg Vorbis (.ogg .oga), FLAC (.flac), Speex (.spx), Opus (.opus), MP3 (.mp3)
- Conteneur : Matroska (.mkv .mka .mks), Ogg (.ogg .ogv .oga .ogx), WebM (.webm .weba)
Archivage
- Tar
Compression
- lzip, gzip, bzip2, 7z, Zip
Liste des principaux formats fermés[3]
Un format propriétaire (ou format fermé) est un format de données dont les spécifications ne sont pas publiques, ou dont l'utilisation est restreinte par son propriétaire.
- Le format des fichiers produits par Microsoft Office : documents Word, classeurs Excel, présentations PowerPoint
- Le format DWG (format utilisé par AutoCAD)
- Les formats des fichiers audios WMA et APE
- Le format des fichiers vidéos WMV
- Le format des partitions NTFS
- Les formats d'archives compressées RAR et ACE
- Les formats des fichiers produits par Adobe Photoshop : .psd
Problématique
Selon Viviane Boulétreau et Benoît Habert[4], les formats soulèvent plusieurs questions. Les premières interrogations qu'ils soulèvent dans leur textes relèvent de l'invisibilité de ces derniers.
- « Consommation » ou modification : le document doit-il seulement être affiché ? Doit-il également être imprimé et, si oui, la mise en page doit-elle impérativement être conservée ? Lors des utilisations futures, est-il supposé être modifié ? Seulement par son auteur ou par d’autres personnes ? Si oui, doit-on garder un historique de ces modifications ? PDF est préférable dans les deux premiers cas, OpenDocument ou .docx pour les suivants, avec les possibilités de suivi de révision qu’ils offrent.
- Public visé : à qui est destiné le document ? L’auteur sera-t-il son seul utilisateur, ou bien d’autres personnes seront-elles amenées à le manipuler ? Les futurs utilisateurs sont-ils a priori connus ou non ? Connaît-on la nature des dispositifs (matériel et applications) que le public visé utilisera, connaît-on son degré de maîtrise de ces outils ? Par exemple, il est tout à fait normal d’échanger des fichiers sous un format très spécifique destiné à une application particulière avec des collègues de travail dont on sait qu’ils sont équipés pour les exploiter. Inversement, un CV à un futur employeur devra impérativement être transmis sous le format le plus répandu et le plus simple d’utilisation possible.
- Mode de transmission : le vecteur utilisé pour transmettre (réseau : site web, FTP, courriel ; support physique mobile : disque, clé USB) peut amener à privilégier un format par rapport un autre. Un document PDF est ainsi souvent plus « léger » que le document Word ou PowerPoint source.
- Durée de vie du document : pendant combien de temps doit-il être utilisable ? Quelques jours ? Quelques semaines ? Doit-il être exploitable sur du plus long terme comme un document administratif pour lequel on considère qu’une dizaine d’années est la durée de vie « légale » ? Dans ce cas, on utilisera le format PDF/A conçu dans cette optique.
Les auteurs soulèvent deux autres points fondamentaux[5] : "Nos objectifs, une fois correctement énoncés, nous permettent la plupart du temps de choisir une famille de formats. Les contraintes techniques, économiques, les choix politiques, les usages d’une communauté suffisent à affiner ce premier tri. Aussi ne sommes-nous pas toujours aussi libres que nous pourrions le souhaiter. En nous plaçant délibérément dans un contexte moins contraint, deux critères complémentaires peuvent nous aider à choisir le format adéquat.
- Interopérabilité : elle est essentielle non seulement si l’objectif est de partager un document avec d’autres utilisateurs, mais également dans une perspective de préservation sur la durée, puisqu’elle permettra d’exploiter un document avec d’autres dispositifs si celui d’origine devenait obsolète. Deux approches sont possibles : l’une basée sur le dispositif consiste à vérifier que, même s’il fonctionne de préférence avec un format qui lui est propre, il est capable de lire et de produire des formats dits d’échange (comme CSV pour les tableaux, PDF, etc.), en garantissant une perte d’information minimale. Cette approche est généralement privilégiée lorsqu’il s’agit de documents spécifiques et que les outils mis en œuvre disposent de fonctionnalités très particulières (publication assistée par ordinateur — PAO —, dessin technique, outils de traitement du signal, etc.). La seconde consiste à choisir d’abord un format gage d’interopérabilité, puis le dispositif qui permettra de le manipuler. Un tel format devra être au moins un standard de facto, voire une norme. On privilégiera bien entendu les formats les plus ouverts possible afin de préserver un minimum de liberté dans le choix du dispositif.
- Pérennité du document: cette préoccupation doit être présente à l’esprit dès la création du document. L’utilisation de formats et de dispositifs disposant d’une solide communauté d’utilisateurs est également un facteur à prendre en compte pour la gestion à long terme des documents. En effet, au-delà du choix du format initial, la préservation des documents suppose une veille constante afin de pouvoir opérer les migrations de support, de format ou d’application chaque fois que l’obsolescence de l’un de ces éléments est signalée."
Bibliographie
Voir l'article de Viviane Boulétreau et Benoît Habert : http://www.parcoursnumeriques-pum.ca/Les-formats
Page wikipédia traitant des formats de données : https://fr.wikipedia.org/wiki/Format_de_donn%C3%A9es
Page wikipédia traitant des formats propriétaires : https://fr.wikipedia.org/wiki/Format_propri%C3%A9taire
Page wikipédia traitant des formats ouverts : https://fr.wikipedia.org/wiki/Format_ouvert
Notes et références
- ↑ https://fr.wikipedia.org/wiki/Format_ouvert#Les_principaux_formats_ouverts
- ↑ https://www.legifrance.gouv.fr/affichTexte.do?cidTexte=JORFTEXT000000801164&dateTexte=&categorieLien=id
- ↑ https://fr.wikipedia.org/wiki/Format_propri%C3%A9taire
- ↑ http://parcoursnumeriques-pum.ca/les-formats
- ↑ http://parcoursnumeriques-pum.ca/les-formats