Format

De ediwiki
Aller à : navigation, rechercher

Crayon.png Cette page est une ébauche, ou est en cours de rédaction.


Définition

En informatique, un format de données est la façon dont est représenté (codé) un type de données, sous forme d'une suite de bits. Par commodité, on interprète cette suite de bits comme un nombre binaire, et on dit par raccourci que la donnée est représentée comme un nombre. Par exemple, le caractère C est généralement codé comme une suite dont 3 bits sont activés, ce que l'on écrit 0100 0011, soit 67 en décimal. Un format de données est ainsi une convention (éventuellement normalisée) utilisée pour représenter des données — des informations représentant un texte, une page, une image, un son, un fichier exécutable, etc. Lorsque ces données sont stockées dans un fichier, on parle de format de fichiers. Une telle convention permet d'échanger des données entre divers programmes informatiques ou logiciels, soit par une connexion directe, soit par l'intermédiaire d'un fichier. On appelle interopérabilité cette possibilité d'échanger des données entre différents logiciels. Un format, c’est quelque chose qui met en forme d’une manière conventionnelle des données destinées à représenter du texte, du son, de l’image, de la vidéo, ou une combinaison des quatre. C’est une sorte de « gabarit » qui met certaines données à des endroits déterminés. Les outils qui vont traiter ce format s’attendent à trouver tel élément à tel endroit, organisé de telle manière, et tel autre à un autre endroit, organisé d’une autre façon.

Problématique

Selon Viviane Boulétreau et Benoît Habert[1], les formats soulèvent plusieurs questions. Les premières interrogations qu'ils soulèvent dans leur textes relèvent de l'invisibilité de ces derniers.

  • « Consommation » ou modification : le document doit-il seulement être affiché ? Doit-il également être imprimé et, si oui, la mise en page doit-elle impérativement être conservée ? Lors des utilisations futures, est-il supposé être modifié ? Seulement par son auteur ou par d’autres personnes ? Si oui, doit-on garder un historique de ces modifications ? PDF est préférable dans les deux premiers cas, OpenDocument ou .docx pour les suivants, avec les possibilités de suivi de révision qu’ils offrent.
  • Public visé : à qui est destiné le document ? L’auteur sera-t-il son seul utilisateur, ou bien d’autres personnes seront-elles amenées à le manipuler ? Les futurs utilisateurs sont-ils a priori connus ou non ? Connaît-on la nature des dispositifs (matériel et applications) que le public visé utilisera, connaît-on son degré de maîtrise de ces outils ? Par exemple, il est tout à fait normal d’échanger des fichiers sous un format très spécifique destiné à une application particulière avec des collègues de travail dont on sait qu’ils sont équipés pour les exploiter. Inversement, un CV à un futur employeur devra impérativement être transmis sous le format le plus répandu et le plus simple d’utilisation possible.
  • Mode de transmission : le vecteur utilisé pour transmettre (réseau : site web, FTP, courriel ; support physique mobile : disque, clé USB) peut amener à privilégier un format par rapport un autre. Un document PDF est ainsi souvent plus « léger » que le document Word ou PowerPoint source.
  • Durée de vie du document : pendant combien de temps doit-il être utilisable ? Quelques jours ? Quelques semaines ? Doit-il être exploitable sur du plus long terme comme un document administratif pour lequel on considère qu’une dizaine d’années est la durée de vie « légale » ? Dans ce cas, on utilisera le format PDF/A conçu dans cette optique.

Les auteurs soulèvent deux autres points fondamentaux[2] : "Nos objectifs, une fois correctement énoncés, nous permettent la plupart du temps de choisir une famille de formats. Les contraintes techniques, économiques, les choix politiques, les usages d’une communauté suffisent à affiner ce premier tri. Aussi ne sommes-nous pas toujours aussi libres que nous pourrions le souhaiter. En nous plaçant délibérément dans un contexte moins contraint, deux critères complémentaires peuvent nous aider à choisir le format adéquat.

  • Interopérabilité : elle est essentielle non seulement si l’objectif est de partager un document avec d’autres utilisateurs, mais également dans une perspective de préservation sur la durée, puisqu’elle permettra d’exploiter un document avec d’autres dispositifs si celui d’origine devenait obsolète. Deux approches sont possibles : l’une basée sur le dispositif consiste à vérifier que, même s’il fonctionne de préférence avec un format qui lui est propre, il est capable de lire et de produire des formats dits d’échange (comme CSV pour les tableaux, PDF, etc.), en garantissant une perte d’information minimale. Cette approche est généralement privilégiée lorsqu’il s’agit de documents spécifiques et que les outils mis en œuvre disposent de fonctionnalités très particulières (publication assistée par ordinateur — PAO —, dessin technique, outils de traitement du signal, etc.). La seconde consiste à choisir d’abord un format gage d’interopérabilité, puis le dispositif qui permettra de le manipuler. Un tel format devra être au moins un standard de facto, voire une norme. On privilégiera bien entendu les formats les plus ouverts possible afin de préserver un minimum de liberté dans le choix du dispositif.
  • Pérennité: cette préoccupation doit être présente à l’esprit dès la création du document. L’utilisation de formats et de dispositifs disposant d’une solide communauté d’utilisateurs est également un facteur à prendre en compte pour la gestion à long terme des documents. En effet, au-delà du choix du format initial, la préservation des documents suppose une veille constante afin de pouvoir opérer les migrations de support, de format ou d’application chaque fois que l’obsolescence de l’un de ces éléments est signalée."
Liste de formats + renvoie à wiki => classification de formats (ouverts, fermés, métadonnés...)
  1. http://parcoursnumeriques-pum.ca/les-formats
  2. http://parcoursnumeriques-pum.ca/les-formats