Pourquoi utiliser des formats ouverts ?

[ français | italiano ]

  1. Qu'est-ce qu'un format ?
  2. Formats ouverts vs. Formats propriétaires
  3. Utilisation et échange de fichiers en format propriétaire
  4. Quatre raisons de ne pas échanger des fichiers en format propriétaire
  5. Quatre raisons d'adopter des formats ouverts
  6. Quels formats propriétaire faut-il éviter?
  7. Quels sont les formats ouverts que je peux utiliser ?
  8. Liens
  9. About this document

1. Qu'est-ce qu'un format ?

Que vous écriviez un article, modifiez une image, construisiez une page web, écoutiez un morceau de musique ou regardiez un film sur votre ordinateur, vous avez à faire à des fichiers. Pour que ces fichiers puissent être ouverts, lus ou modifiés par vos logiciels préférés, il faut qu'ils aient un format. Un format est ce qui permet à un logiciel d'interpréter les données brutes d'un fichier. C'est, autrement dit, le mode de représentation de ces données. Souvent, les formats des fichiers sont indiqués par leur extension : le suffixe (souvent trois lettres) attaché au nom de fichier. Par exemple : mapageweb.htm est un fichier en format HTML. Il existe des formats spécifiques pour les images (par exemple JPEG, PNG, GIF, TIF, BMP), pour les textes sans mise en forme (ASCII, souvent indiqué comme TXT), pour les textes avec mise en forme (HTML, RTF, DOC), pour les pages prêtes à l'impression (PDF, PS) etc.

2. Formats ouverts vs. Formats propriétaires

Afin de travailler avec un fichier, vous aurez besoin la plupart du temps d'un logiciel qui vous permette de lire, modifier ou enregistrer les données de ce fichier.

open FORMAT OUVERT - On dira que le format d'un fichier est ouvert si le mode de représentation de ses données est transparent et/ou sa spécification appartient au domaine public. Il s'agit principalement de standards établis par des autorités publiques ou des institutions internationales, dont le but est de fixer des normes assurant l'interopérabilité entre logiciels. Il existe pourtant plusieurs cas de formats ouverts promus par des entreprises ayant décidé de rendre publique la spécification de leurs formats.
Il est à noter qu'un format ouvert peut être codé de manière transparente (lisible dans n'importe quel éditeur texte: c'est le cas des langages de markup) ou bien en format binaire (illisible dans un éditeur texte, mais complètement déchiffrable par la spécification publique fournie par le producteur).

close FORMAT PROPRIETAIRE - On dira qu'un format est propriétaire si le mode de représentation de ses données est opaque et sa spécification n'appartient pas au domaine public. Il s'agit de formats devéloppés par des entreprises afin de coder les données d'une application qu'elle produit: seuls les logiciels produits par cette entreprise seront capables de lire correctement et complètement les données contenues dans un fichier à format propriétaire. Les formats propriétaires peuvent être légalement protégés par des brevets et imposer le versement de royalties à tous ceux qui les utilisent.
Note terminologique: nous appelons format propriétaire ce que d'autres appellent format fermé. Nous n'entendons pas suggérer par notre choix terminologique que tout ce qui n'est pas propriétaire appartient au domaine des standards publics. On a souligné dans le paragraphe précédent qu'il existe plusieurs formats à spécification publique (= "ouverts") qui ont été devéloppés par des entreprises. La différence entre ouvert et propriétaire (ou fermé) consiste exclusivement dans l'existence ou la non existence d'une spécification publique du format.

Dans ce qui suit, les formats ouverts seront marqués par l'icone open, les formats propriétaires par l'icone close

3. Utilisation et échange de fichiers en format propriétaire

Les formats propriétaires sont aujourd'hui très répandus, car ils sont utilisés par un grand nombre de logiciels d'édition et de manipulation de textes ou d'images. Un format propriétaire encode les données de telle manière que le fichier résultant n'est lisible qu'avec le logiciel créé pour les décoder. A l'inverse, un format ouvert garantit que le fichier puisse être lu par n'importe quel logiciel écrit à cet effet.
La différence entre format ouvert et format propriétaire peut passer inaperçue lorsque l'on ne fait qu'un usage local de ses fichiers. Par usage local nous entendons tout usage personnel de fichiers aussi bien que tout usage de fichiers avec d'autres utilisateurs avec lesquels il y a un accord implicite sur le logiciel à utiliser pour la lecture des fichiers.
Dès que l'usage n'est plus local et dès qu'on échange des fichiers (en les mettant en ligne, en les publiant, en les envoyant en pièce jointe à un message d'email, bref: dans toute forme de communication pour laquelle il n'y a aucun accord implicit avec le destinataire sur le logicielà utiliser pour la lecture des fichiers), cette distinction devient cruciale.

4. Quatre raisons de ne pas échanger des fichiers en format propriétaire close

Des formats propriétaires peuvent être utilisés localement sans risques par un utilisateur pour son usage personnel ou par une communauté d'utilisateurs qui aient préalablement décidé de s'en servir pour un travail coopératif. Echanger des fichiers est en revanche une pratique sociale dont les effets ne concernent plus l'utilisateur isolé, mais l'ensemble des possibles utilisateurs de ces fichiers. Echanger des fichiers demande la conversion du format originaire vers un format approprié à l'échange. Les formats ouverts sont par définition des formats d'échange: il garantissent l'accessibilité, l'interopérabilité et la pérennité du contenu.
En échangeant des fichiers en format propriétaire vous contribuez en revanche à propager et à renforcer des pratiques indésirables.

  • Prendre le risque que le destinataire ne puisse pas lire un fichier

    a. Un format propriétaire demande l'achat d'un logiciel spécifique capable de décoder l'information contenue dans les fichiers. L'échange de fichiers en format propriétaire présuppose donc que le destinataire possède le logiciel capable de lire ce format: tout utilisateur n'ayant pas les moyens d'acheter le logiciel de décodification ne sera jamais en mesure de lire ces fichiers.

    b. Certes, le logiciel peut être acheté. Supposons que le destinataire ait acheté le logiciel nécessaire à la lecture du fichier. Est-ce que cela garantit une accessibilité complète au fichier? Malheureusement non: une stratégie largement suivie par les entreprises de production de logiciels consiste à modifier progressivement les formats dont elles détiennent la propriété. Ceux qui veulent continuer à utiliser ces formats de fichier seront ainsi obligés à acheter les mises à jour du logiciel.

    c. Une stratégie aux effets similaires («  Embrace and Enhance  ») consiste à adopter à l'origine des formats ouverts en les modifiant progressivement avec du code propriétaire, ce qui les rend peu à peu incompatibles avec les formats utilisés par d'autres logiciels et force de fait une conversion du format public originaire vers un format propriétaire.

    L'adoption de formats propriétaires ou semi-proprietaires répond en général à des stratégies d'entreprise qui ne correspondent pas aux exigences de l'utilisateur, dont l'intérêt va à l'accessibilité, à l'intéropérabilité et à la pérennité du contenu échangé.

  • Prendre le risque de diffuser des informations confidentielles

    Un format propriétaire encode des informations qui ne sont pas publiquement visibles. Seul le producteur du format ou le propriétaire du logiciel de lecture, détenant les clef pour le décodage complet du format, est en mesure d'accéder à ces informations.
    Souvent, au moment de l'enregistrement, le logiciel rajoute aux fichiers des informations qui ne sont pas accessibles à l'utilisateur commun, telles que le nom de l'utilisateur, le numéro de série du logiciel, le type de système d'exploitation, la machine sur laquelle l'utilisateur travaille, le dossier dans lequel le fichier se trouve, etc. Certaines de ces informations sont parfois codées de manière lisible à l'insu de l'auteur et deviennent ainsi complètement accessibles à tout le monde: l'anécdote du manifeste politique anonyme diffusé en format MSWord contenant le nom de l'auteur parfaitement lisible dans les propriétés du document est peut-être le cas le plus célèbre des conséquences inattendues de l'utilisation de formats propriétaires comme formats d'échange.
    Des conséquences bien plus graves sont à envisager là où il ne s'agit pas de simple violation de la privacy de données personnelles, mais de diffusion d'informations militaires ou de secret commerciaux. Il est assez curieux qu'on accepte sans problèmes que les documents produits et échangés par le ministère de la Défense d'un pays X contiennent une partie accessible exclusivement à une entreprise du Pays Y.
    Diffuser des documents en format propriétaire signifie diffuser de l'information dont personne, hormis le propriétaire du logiciel de lecture, ne peut connaître exactement le contenu [en savoir plus].

  • Contribuer à la diffusion de virus et s'exposer au risque de contamination

    Pour les raisons expliquées dans le paragraphe précédent, plusieurs virus se propagent à l'aide dl'information encodée dans les fichiers qui n'est pas complètement transparente à l'utilisateur. Diffuser et accepter des documents en format propriétaire, c'est donc prendre le risque de contaminer et de se faire contaminer par des virus informatiques cachés dans les parties illisibles du code.
    Il faut noter qu'on réplique souvent le fait que même des formats ouverts sont susceptibles de vehiculer des virus: ceci est faux, dans la mesure où les formats considérés sont des formats ouverts au sens strict. Aussitôt qu'un format contient des greffes propriétaires (par exemple, du HTML contenant du code pour lancer une application externe ou un PDF contenant des macros interpretables par un logiciel propriétaire) ce format devient susceptible d'être contaminé par des virus: il ne s'agit plus dans ces cas de formats ouverts, mais de formats semi-propriétaires.

  • Renforcer les monopoles de fait qui existent dans le domaine de l'informatique

    Ce problème n'est pas sensible au niveau de l'utilisateur isolé, mais il concerne de manière cruciale la communauté des utilisateurs. En diffusant des fichiers en format propriétaire, on force implicitement le destinataire à choisir le même logiciel utilisé par celui qui diffuse les fichiers. Le message qu'on communque implicitement lors de l'échange d'un fichier en format propriétaire est le suivant: "Sert toi du même logiciel que j'ai utilisé ou tu ne pourras pas lire le contenu de ce fichier". Cette pratique - la même qui se produit lorsque celui qui diffuse des fichiers assume sans justification que "tous les destinataires du fichier possèdent sûrement le même logiciel " - a une double conséquence:

    1. Premièrement, cette pratique impose et renforce l'utilisation de fait d'un format proprietaire comme format d'échange: ce qui signifie lier l'interopérabilité, l'accessibilité et la pérennité du contenu des fichiers aux choix politiques contingents du producteur de software. Si ce-dernier décide un jour (ou se trouve obligé) de terminer la production du logiciel de lecture/écriture du format considéré, tous les fichiers existants dans ce format deviendront automatiquement inutilisables: la spécification du format étant inaccessible, il sera impossible de récupérer le contenu de ces fichiers devenus obsolètes.

    2. Deuxièmement, en imposant un monopole de fait, cette pratique limite fortement une concurrence équitable entre les producteurs de software, concurrence qui représente la condition universalement reconnue pour le devéloppement téchnologique, et affaiblit la pratique d'ouverture des spécifications de formats et la recherche de standards publics pour le devéloppement de logiciels, qui est un présupposé de la dite concurrence.

5. Quatre raisons d'adopter des formats ouverts open

Utiliser des formats publics dans l'échange de fichiers signifie :

  • S'assurer que le destinataire sera toujours libre de les lire
  • Garantir une transparence parfaite au niveau du contenu des données échangées
  • Limiter la diffusion de virus
  • Cultiver la diversité et l'interopérabilité dans le domaine de l'informatique personnelle.

6. Quels formats propriétaires faut-il éviter ?

Les formats propriétaires ne sont pas des formats d'échange. La plupart des documents en formats propriétaires destinés à la diffusion ou à la publication électronique peuvent être facilement remplacés ou convertis en formats ouverts offrant les mêmes caractéristiques. Les principaux formats propriétaires à éviter sont les suivants:

  • Documents de texte mis en forme MS Word (DOC) close

    Le format de document MS Word est un format propriétaire semi-trasparent devéloppé par Microsoft. Cela signifie qu'une partie des informations qu'il encode sont accessibles alors que d'autres ne le sont pas.
    Les mêmes caractéristiques de formatage et mise en page des documents MS Word sont supportées par le format ouvert Ooo - standard basé sur l'XML et devéloppé par la suite libre OpenOffice qui répond aux critères d'accéssibilité établis par le W3 Consortium: le format OpenOffice - pour ses caractéristiques de portabilité et compatibilité - aspire à devenir la référence pour les standards de documents formatés.
    Si le texte n'est pas destiné à l'édition de la part du destinataire, la solution optimale est d'utiliser le format ouvert HTML, lisible dans tout navigateur et éditable dans n'importe quel éditeur de texte. Dans le cas où une mise en page précise est requise (par exemple pour documents destinés à l'impression), les formats ouverts appropriés sont le PS et le PDF. Pour les textes scientifiques, les format s ouverts de référence sont le TeX et le DVI.
    Une solution non optimale, mais toujours meilleure que celle d'utiliser le format MS Word dans le cas d'un travail coopératif est d'utiliser le format semi-propriétaire RTF, qui a dans sa version native a une spécification et qui est lisible avec la plupart des logiciels de vidéoécriture.

  • Tables et bases de données MS Excel (XLS) close

    MS Excel est un format propriétaire devéloppé par Microsoft. La meilleure alternative ouverte pour sauvegarder et publier de volumineux tableaux de données textuelles est d'utiliser du texte brut avec séparateurs ("Comma Separated Values" - CSV). Le CSV peut être lu, modifié et sauvegardé avec tous les logiciels de traitement de bases de données et a un poids très limité.
  • Présentations MSPowerPoint (PPS et PPT) close

    Les présentations en format propriétaire MS Powerpoint disponibles en ligne sont de plus en plus fréquentes: la meilleure solution pour la publication et la diffusion de présentations en format ouvert (à condition que les effets de transition et d'animation ne soient pas nécessaires) est le format PDF qui offre une excellente alternative tant par rapport à la qualité (les graphiques vectoriels peuvent être agrandis sans limites) quà la portabilité (la mise en page et les formatages ne changent pas selon la plate-forme).
  • Images bitmap à 256 couleurs (GIF) close

    Pour des images qui ne demandent pas une large gamme chromatique, le format propriétaire GIF peut facilement être remplacé par son équivalent ouvert, le PNG.
  • Images bitmap de haute qualité (BMP, TIF) close

    Pour des images qui demandent une définition chromatique plus fine, des formats propriétaires tels que BMP ou TIF peuvent être remplacés par le standard ouvert JPEG
  • Images vectorielles (WMF) close

    Le format d'image vectorielle WMF peut être remplacé par son équivalent ouvert, le SVG.



    Plus d'informations sur les différents formats propriétaires et ouverts sont disponibles ici

7. Quels sont les formats ouverts que je peux utiliser ?


La manière plus simple de lire, sauvegarder et échanger du texte est d'utiliser le format ASCII.

  • Texte brut (ASCII) open

    Dès que vous en avez la possibilité, évitez tout simplement d'utiliser du texte formaté : utiliser du texte brut (en format ascii ou .txt) garantit à votre destinataire une accessibilité complète, indépendamment du logiciel, du système d'exploitation et de la machine sur laquelle il/elle travaille. Dans vos émails, si c'est le contenu qui vous intéresse plutôt que la mise en page, envoyez le texte directement dans le corps de vos messages plutôt que dans une pièce jointe.
    Le texte brut ne diffuse aucun virus, est très légér et peut facilement être utilisé pour créer des tables (à l'aide de tabulations ou virgules) que tout logiciel est en mesure de lire.



    Si vous avez besoin d'échanger des documents contenant des images et du texte avec mise en forme, la meilleure solution est d'utiliser le format HTML.

  • Hyper Text Markup Language (HTML) open

    Le format HTML est le langage standard du web et sa définition est fixée par une organisation internationale de normalisation (le W3_Consortium). L'HTML est un format universel très flexible, riche et compact. Le HTML natif (sans javascript) ne diffuse pas de virus et peut être lu par n'importe quelle plate-forme.
    Note: Le code HTML produit par Word est semi-propriétaire, ce qui le rend susceptible d'inclure des informations non affichables sur toutes les plateformes.



    L'édition et mise en forme de documents mathématiques s'appuie à un format ouvert dédié, le TeX.
  • TeX, LaTeX et Device Independent Format (DVI) open

    TeX est à la fois un langage de mise en forme de document et un langage de programmation. Ecrit à l'origine pour une mise en forme professionnelle de documents mathématiques, il est aujourd'hui utilisé dans de nombreux autres domaines.

    LaTeX est aussi un langage de mise en forme de document et de programmation. Il s'agit en fait d'un dérivé simplifié de TeX permettant de manipuler des instructions de haut niveau, de la même manière que le HTML est une simplification dérivée du SGML.

    DVI. Un fichier source TeX ou LaTeX a besoin d'être compilé. Le résultat de cette compilation est au format DVI, lisible depuis n'importe quelle plateforme. Le plus souvent, ce résultat de la compilation sera à son tour être converti en PDF ou
    PS.


    Si vous avez besoin de travailler de manière collaborative sur le même texte, et vous ne pouvez pas manipuler des fichiers HTML, une solution viable est d'utiliser un format semi-ouvert comme le Rich Text Format.

  • Rich Text Format (RTF) open

    Le format RTF, a été introduit par Microsoft dans le but de créer un format standard pour le texte mis en forme. Il offre la même richesse du format DOC, tout en étant (du moins dans sa version native) un format à spécification publique. La plupart des logiciels de traitement de texte sont capable d'écrire et lire ce format, mais comme certains logiciels ont tendence à utiliser des extensions propriétaires de ce format, sa compatibilité reste relative.


    Si vous avez besoin de présenter ou imprimer documents avec une mise en page de haute qualité, les formats PostScript (PS) et Portable Document Format (PDF) représentent la meilleure solution disponible.

  • PostScript (PS) open

    Le format PostScript est un langage de description de page, développé par Adobe en 1985, déstiné à l'impression et largement utilisé dans le domaine de la typographie. Il présente l'avantage d'être universel (indépendant du format du fichier d'origine) et de ne pas transmettre des virus. A l'inverse du format PDF, le PostScript ne permet pas de copier du texte affiché à l'écran pour le coller dans une autre application. Il peut être généré à partir d'imprimantes compatibles (option: 'imprimer dans fichier') et avec le logiciel libre GhostScript.

  • Portable Document Format (PDF) open

    Le format PDF (Portable Document Format), développé par Adobe, est un format de présentation de documents, dont la spécification est disponible sur le web. Il s'agit d'un format universel (indépendant de la plateforme et du logiciel utilisé pour le créer), compatible avec toute imprimante, flexible (permet la substitution de polices, l'ajout de liens, de signets, notes) et lisible à l'écran avec les plugins appropriés. Il peut être généré avec Adobe Acrobat et avec le logiciel libre GhostScript.



    Les principaux formats ouverts disponibles pour les images sont les suivants:
  • Joint Photographic Expert Group (JPEG) open

    Le JPEG est parmi les plus efficaces formats de compression d'images disponibles à ce jour. Ce format ouvert très léger permet de déterminer le taux de compression des données, sachant que plus la compression est élevée plus la dégradation de l'image est sensible. JPEG est un procédé de compression cumulatif : l'image se dégrade sensiblement au fur et à mesure qu'on l'ouvre et qu'on la sauvegarde en la comprimant.
    Une variante de ce format, le JPEG progressif, permet d'optimiser les délais d'affichage de l'image sur Internet. Le nouveau standard JPEG_2000, actuellement en phase de définition, permettra un meilleur rapport qualité/compression aussi bien que l'indexation d'images par des mots-clé.

  • Portable Network Graphics (PNG) open

    Le PNG-8 et le PNG-24 sont deux formats ouverts et libres de droits. Ils représentent la principale alternative au format GIF, spécialement mise au point pour optimiser l'affichage des images sur internet. Ils permettent une compression des données qui ne comporte aucune perte d'information et ils sont supportés par la plupart des browsers.
    Le poids d'un fichier PNG reste nettement plus élevé que son équivalent en JPEG. En revanche, PNG remplacera avantageusement le GIF pour les images 8 bits et inférieures.

  • Scalable Vector Graphics (SVG) open

    Pour ce qui en est des formats vectoriels, un format ouvert est disponible à la suite des travaux d'un groupe de recherche créé en 1998 par le W3_Consortium: le Scalable Vector Graphics (SVG). Il s'agit d'un format basé sur d'autres standards publics (XML, CSS, HTML) permettant la construction d'images vectorielles et retaillables, idéales pour économiser la bande passante, pour optimiser la mise en page et pour permettre de zoomer sans dégradation de l'image. Les graphiques créés en SVG peuvent être dynamiques et intéractifs, permettent de grouper, transformer, composer les objets graphiques dans d'autres objets et recevoir des attributs de style.


8. Liens

a. Organisations

World Wide Web Consortium (W3)
Document Formats Domain - Interaction Domain

OASIS
A non-profit, international consortium that creates interoperable industry specifications based on public standards

OpenStandards
A not-for-profit organization connecting people to open standards and the bodies that build and foster their growth.

OpenWeb
Ressource francophone sur les standards Web

AFUL
Groupe de travail sur l'interopérabilité

Web Standards (WASP)
A grassroots coalition fighting for standards that ensure simple, affordable access to web technologies for all

 

b. Initiatives pour la promotion des formats ouverts

GNU
Why there are not GIF files on GNU pages

Jeff Goldberg
MS-Word is Not a document exchange format

IRISA
Recommandations sur le format d'échange des documents

Lune rouge
Guide aux formats ouverts et aux formats propriétaires

Département de Mathématique de Jussieu
A propos de la manipulation de documents Word

OpenMeans
Promouvoir les spécifications publiques des formats sans renoncer aux logiciels propriétaires.

OpenOffice
Site officiel de la suite logicielle libre basée sur des standards ouverts.

Bruce Perens
Open Standards: Principles and Practice

Raphaël Rousseau
Court argumentaire en faveur des formats ouverts

Thomas Petazzoni
Formats ouverts : pourquoi et comment les utiliser ?

Sincere Choice
Open formats, interoperability and research availability

Richard Stallman
We Can Put an End to Word Attachments

Sam Steingold
No Proprietary Binary Data Formats

Thierry Stoehr
Le formats des fichiers [conférence en format .ogg]

Samuel Tardieu
Pourquoi pas Word

Transfert.net
Les vices cachés des .doc

Martin Vermeer
Plaintext : In praise of practical e-mail hygiene

 

c. Résolutions institutionnelles et actions législatives

UNESCO
Preliminary Draft Charter on the Preservation of the Digital Heritage

University of Buffalo, New York
Resolution for University Support of Open Software and Standards

National Advisory Council on Innovation, South Africa
Open Software & Open Standards in South Africa - A Critical Issue for Addressing the Digital Divide

State of Oregon
Open source bill

State of California
Digital Software Security Act

United Kingdom
E-Government Interoperability Framework

 

 

Dernière mise à jour: 4 novembre, 2003
Bastien Guerry
, Dario Taraborelli
Valid HTML 4.01!Valid CSS!