Pourquoi utiliser des formats ouverts ?
[ français | italiano ]
1. Qu'est-ce qu'un format ?
Que vous écriviez un article, modifiez une image, construisiez une page web,
écoutiez un morceau de musique ou regardiez un film sur votre ordinateur, vous
avez à faire à des fichiers. Pour que ces fichiers puissent être ouverts, lus ou
modifiés par vos logiciels préférés, il faut qu'ils aient un
format. Un format est ce qui permet à un logiciel d'interpréter
les données brutes d'un fichier. C'est, autrement dit, le mode de représentation
de ces données. Souvent, les formats des fichiers sont indiqués par leur
extension : le suffixe (souvent trois lettres) attaché au nom de fichier.
Par exemple : mapageweb.htm est un fichier en format HTML. Il
existe des formats spécifiques pour les images (par exemple JPEG, PNG, GIF, TIF,
BMP), pour les textes sans mise en forme (ASCII, souvent indiqué comme TXT),
pour les textes avec mise en forme (HTML, RTF, DOC), pour les pages prêtes à
l'impression (PDF, PS) etc.
2. Formats ouverts vs. Formats propriétaires
Afin de travailler avec un fichier, vous aurez besoin la plupart du temps
d'un logiciel qui vous permette de lire, modifier ou enregistrer les données de
ce fichier.
FORMAT OUVERT - On dira que le format d'un fichier est
ouvert si le mode de représentation de ses données est transparent et/ou
sa spécification appartient au domaine public. Il s'agit principalement de
standards établis par des autorités publiques ou des institutions
internationales, dont le but est de fixer des normes assurant l'interopérabilité
entre logiciels. Il existe pourtant plusieurs cas de formats ouverts promus par
des entreprises ayant décidé de rendre publique la spécification de leurs
formats.
Il est à noter qu'un format ouvert peut être codé de manière
transparente (lisible dans n'importe quel éditeur texte: c'est le cas
des langages de markup) ou bien en format binaire (illisible dans un
éditeur texte, mais complètement déchiffrable par la spécification publique
fournie par le producteur).
FORMAT PROPRIETAIRE - On dira qu'un format est
propriétaire si le mode de représentation de ses données est opaque et sa
spécification n'appartient pas au domaine public. Il s'agit de formats
devéloppés par des entreprises afin de coder les données d'une application
qu'elle produit: seuls les logiciels produits par cette entreprise seront
capables de lire correctement et complètement les données
contenues dans un fichier à format propriétaire. Les formats propriétaires
peuvent être légalement protégés par des brevets et imposer le versement de
royalties à tous ceux qui les utilisent.
Note
terminologique: nous appelons format propriétaire ce que d'autres
appellent format fermé. Nous n'entendons pas suggérer par notre choix
terminologique que tout ce qui n'est pas propriétaire appartient au domaine des
standards publics. On a souligné dans le paragraphe précédent qu'il existe
plusieurs formats à spécification publique (= "ouverts") qui ont été
devéloppés par des entreprises. La différence entre ouvert et propriétaire (ou
fermé) consiste exclusivement dans l'existence ou la non existence d'une
spécification publique du format.
Dans ce qui suit, les formats ouverts
seront marqués par l'icone
,
les formats
propriétaires par l'icone
3. Utilisation et échange de fichiers en format propriétaire
Les formats propriétaires sont aujourd'hui très répandus, car ils sont
utilisés par un grand nombre de logiciels d'édition et de manipulation de textes
ou d'images. Un format propriétaire encode les données de telle manière que le
fichier résultant n'est lisible qu'avec le logiciel créé pour les décoder. A
l'inverse, un format ouvert garantit que le fichier puisse être lu par n'importe
quel logiciel écrit à cet effet.
La différence entre format ouvert et format
propriétaire peut passer inaperçue lorsque l'on ne fait qu'un usage local de ses
fichiers. Par usage local nous entendons tout usage personnel de
fichiers aussi bien que tout usage de fichiers avec d'autres utilisateurs avec
lesquels il y a un accord implicite sur le logiciel à utiliser pour la lecture
des fichiers.
Dès que l'usage n'est plus local et dès qu'on échange
des fichiers (en les mettant en ligne, en les publiant, en les envoyant
en pièce jointe à un message d'email, bref: dans toute forme de communication
pour laquelle il n'y a aucun accord implicit avec le destinataire sur le
logicielà utiliser pour la lecture des fichiers), cette distinction devient
cruciale.
4. Quatre raisons de ne pas échanger des fichiers en format propriétaire
Des formats propriétaires peuvent être utilisés localement sans
risques par un utilisateur pour son usage personnel ou par une communauté
d'utilisateurs qui aient préalablement décidé de s'en servir pour un
travail coopératif. Echanger des fichiers est en revanche une pratique
sociale dont les effets ne concernent plus l'utilisateur isolé, mais
l'ensemble des possibles utilisateurs de ces fichiers. Echanger
des fichiers demande la conversion du format originaire vers un format
approprié à l'échange. Les formats ouverts sont par définition des formats
d'échange: il garantissent l'accessibilité, l'interopérabilité et la pérennité
du contenu.
En échangeant des fichiers en format propriétaire vous
contribuez en revanche à propager et à renforcer des pratiques
indésirables.
- Prendre le risque que le destinataire ne puisse pas lire un
fichier
a. Un format propriétaire demande l'achat d'un logiciel spécifique
capable de décoder l'information contenue dans les fichiers. L'échange
de fichiers en format propriétaire présuppose donc que le destinataire
possède le logiciel capable de lire ce format: tout utilisateur n'ayant
pas les moyens d'acheter le logiciel de décodification ne sera jamais en
mesure de lire ces fichiers.
b. Certes, le logiciel peut
être acheté. Supposons que le destinataire ait acheté le logiciel
nécessaire à la lecture du fichier. Est-ce que cela garantit une
accessibilité complète au fichier? Malheureusement non: une stratégie
largement suivie par les entreprises de production de logiciels consiste
à modifier progressivement les formats dont elles détiennent la
propriété. Ceux qui veulent continuer à utiliser ces formats de fichier
seront ainsi obligés à acheter les mises à jour du logiciel.
c. Une stratégie aux effets similaires («
Embrace and Enhance ») consiste à adopter à l'origine des
formats ouverts en les modifiant progressivement avec du code
propriétaire, ce qui les rend peu à peu incompatibles avec les formats
utilisés par d'autres logiciels et force de fait une conversion
du format public originaire vers un format propriétaire.
L'adoption de formats propriétaires ou semi-proprietaires répond
en général à des stratégies d'entreprise qui ne correspondent pas aux
exigences de l'utilisateur, dont l'intérêt va à l'accessibilité, à
l'intéropérabilité et à la pérennité du contenu échangé.
-
Prendre le risque de diffuser des informations confidentielles
Un format propriétaire encode des informations qui ne sont pas
publiquement visibles. Seul le producteur du format ou le propriétaire
du logiciel de lecture, détenant les clef pour le décodage complet du
format, est en mesure d'accéder à ces informations. Souvent, au
moment de l'enregistrement, le logiciel rajoute aux fichiers des
informations qui ne sont pas accessibles à l'utilisateur commun, telles
que le nom de l'utilisateur, le numéro de série du logiciel, le type de
système d'exploitation, la machine sur laquelle l'utilisateur travaille,
le dossier dans lequel le fichier se trouve, etc. Certaines de ces
informations sont parfois codées de manière lisible à l'insu de l'auteur
et deviennent ainsi complètement accessibles à tout le monde: l'anécdote
du manifeste politique anonyme diffusé en format MSWord contenant le nom
de l'auteur parfaitement lisible dans les propriétés du document est
peut-être le cas le plus célèbre des conséquences inattendues de
l'utilisation de formats propriétaires comme formats d'échange. Des
conséquences bien plus graves sont à envisager là où il ne s'agit pas de
simple violation de la privacy de données personnelles, mais de
diffusion d'informations militaires ou de secret commerciaux. Il est
assez curieux qu'on accepte sans problèmes que les documents produits et
échangés par le ministère de la Défense d'un pays X contiennent une
partie accessible exclusivement à une entreprise du Pays Y. Diffuser
des documents en format propriétaire signifie diffuser de l'information
dont personne, hormis le propriétaire du logiciel de lecture, ne peut
connaître exactement le contenu [en savoir plus].
-
Contribuer à la diffusion de virus et s'exposer au risque de
contamination
Pour les raisons expliquées dans le paragraphe précédent, plusieurs
virus se propagent à l'aide dl'information encodée dans les fichiers qui
n'est pas complètement transparente à l'utilisateur. Diffuser et
accepter des documents en format propriétaire, c'est donc prendre le
risque de contaminer et de se faire contaminer par des virus
informatiques cachés dans les parties illisibles du code. Il faut
noter qu'on réplique souvent le fait que même des formats ouverts
sont susceptibles de vehiculer des virus: ceci est faux,
dans la mesure où les formats considérés sont des formats ouverts au
sens strict. Aussitôt qu'un format contient des greffes
propriétaires (par exemple, du HTML contenant du code pour lancer une
application externe ou un PDF contenant des macros interpretables par un
logiciel propriétaire) ce format devient susceptible d'être contaminé
par des virus: il ne s'agit plus dans ces cas de formats ouverts, mais
de formats
semi-propriétaires.
-
Renforcer les monopoles de fait qui existent dans le domaine de
l'informatique
Ce problème n'est pas sensible au niveau de l'utilisateur isolé, mais
il concerne de manière cruciale la communauté des utilisateurs. En
diffusant des fichiers en format propriétaire, on force implicitement le
destinataire à choisir le même logiciel utilisé par celui qui diffuse
les fichiers. Le message qu'on communque implicitement lors de l'échange
d'un fichier en format propriétaire est le suivant: "Sert toi du
même logiciel que j'ai utilisé ou tu ne pourras pas lire le contenu de
ce fichier". Cette pratique - la même qui se produit lorsque celui
qui diffuse des fichiers assume sans justification que "tous les
destinataires du fichier possèdent sûrement le même logiciel " - a
une double conséquence:
1. Premièrement, cette pratique impose et
renforce l'utilisation de fait d'un format proprietaire comme format
d'échange: ce qui signifie lier l'interopérabilité, l'accessibilité
et la pérennité du contenu des fichiers aux choix politiques contingents
du producteur de software. Si ce-dernier décide un jour (ou se trouve
obligé) de terminer la production du logiciel de lecture/écriture du
format considéré, tous les fichiers existants dans ce format deviendront
automatiquement inutilisables: la spécification du format étant
inaccessible, il sera impossible de récupérer le contenu de ces fichiers
devenus obsolètes.
2. Deuxièmement, en imposant un monopole de
fait, cette pratique limite fortement une concurrence équitable entre
les producteurs de software, concurrence qui représente la condition
universalement reconnue pour le devéloppement téchnologique, et
affaiblit la pratique d'ouverture des spécifications de formats
et la recherche de standards publics pour le devéloppement de logiciels,
qui est un présupposé de la dite
concurrence.
|
5. Quatre raisons d'adopter des formats ouverts
Utiliser des formats publics dans l'échange de fichiers signifie :
- S'assurer que le destinataire sera toujours libre de les lire
- Garantir une transparence parfaite au niveau du contenu des données
échangées
- Limiter la diffusion de virus
- Cultiver la diversité et l'interopérabilité dans le domaine de
l'informatique personnelle.
|
6. Quels formats propriétaires faut-il éviter ?
Les formats propriétaires ne sont pas des formats
d'échange. La plupart des documents en formats propriétaires
destinés à la diffusion ou à la publication électronique peuvent être
facilement remplacés ou convertis en formats ouverts offrant les mêmes
caractéristiques. Les principaux formats propriétaires à éviter sont les
suivants:
- Documents de texte mis en forme MS Word
(DOC)

Le format de document MS Word est un
format propriétaire semi-trasparent devéloppé par Microsoft.
Cela signifie qu'une partie des informations qu'il encode sont
accessibles alors que d'autres ne le sont pas. Les mêmes
caractéristiques de formatage et mise en page des documents MS Word sont
supportées par le format ouvert Ooo - standard basé sur l'XML et
devéloppé par la suite libre OpenOffice qui répond aux critères
d'accéssibilité établis par le W3 Consortium: le format OpenOffice -
pour ses caractéristiques de portabilité et compatibilité - aspire à
devenir la référence pour les standards de documents formatés. Si le
texte n'est pas destiné à l'édition de la part du destinataire, la
solution optimale est d'utiliser le format ouvert HTML, lisible dans
tout navigateur et éditable dans n'importe quel éditeur de texte. Dans
le cas où une mise en page précise est requise (par exemple pour
documents destinés à l'impression), les formats ouverts appropriés sont
le PS et le PDF. Pour les
textes scientifiques, les format s ouverts de référence sont le TeX et le DVI. Une
solution non optimale, mais toujours meilleure que celle d'utiliser le
format MS Word dans le cas d'un travail coopératif est d'utiliser le
format semi-propriétaire RTF, qui a dans sa
version native a une spécification et qui est lisible avec la plupart
des logiciels de vidéoécriture.
- Tables et bases de données MS Excel (XLS)
MS Excel est un format propriétaire devéloppé par
Microsoft. La meilleure alternative ouverte pour sauvegarder et publier
de volumineux tableaux de données textuelles est d'utiliser du texte
brut avec séparateurs ("Comma Separated Values" - CSV). Le CSV peut
être lu, modifié et sauvegardé avec tous les logiciels de traitement de
bases de données et a un poids très limité.
- Présentations MSPowerPoint (PPS et PPT)
Les présentations en format propriétaire MS
Powerpoint disponibles en ligne sont de plus en plus fréquentes: la
meilleure solution pour la publication et la diffusion de présentations
en format ouvert (à condition que les effets de transition et
d'animation ne soient pas nécessaires) est le format PDF qui offre une
excellente alternative tant par rapport à la qualité (les graphiques
vectoriels peuvent être agrandis sans limites) quà la portabilité (la
mise en page et les formatages ne changent pas selon la
plate-forme).
- Images bitmap à 256 couleurs (GIF)
Pour des
images qui ne demandent pas une large gamme chromatique, le format
propriétaire GIF peut facilement être remplacé par
son équivalent ouvert, le PNG.
- Images bitmap de haute qualité (BMP, TIF)
Pour des images qui demandent une définition
chromatique plus fine, des formats propriétaires tels que BMP ou TIF
peuvent être remplacés par le standard ouvert JPEG
- Images vectorielles (WMF)

Le format d'image vectorielle WMF peut être
remplacé par son équivalent ouvert, le SVG.
Plus d'informations sur les différents formats propriétaires et
ouverts sont disponibles ici
|
7. Quels sont les formats ouverts que je peux utiliser ?
La manière plus simple de lire, sauvegarder
et échanger du texte est d'utiliser le format ASCII.
- Texte brut (ASCII)
Dès que vous en avez la possibilité, évitez tout simplement
d'utiliser du texte formaté : utiliser du texte brut (en format
ascii ou .txt) garantit à votre destinataire une accessibilité complète,
indépendamment du logiciel, du système d'exploitation et de la machine
sur laquelle il/elle travaille. Dans vos émails, si c'est
le contenu qui vous intéresse plutôt que la mise en page, envoyez le
texte directement dans le corps de vos messages plutôt que dans une
pièce jointe. Le texte brut ne diffuse aucun
virus, est très légér et peut facilement être utilisé pour créer des
tables (à l'aide de tabulations ou virgules) que tout logiciel est en
mesure de lire.
Si vous avez besoin d'échanger des documents
contenant des images et du texte avec mise en forme, la meilleure
solution est d'utiliser le format HTML.
- Hyper Text Markup Language (HTML)
Le format HTML est le langage standard du web et sa définition est
fixée par une organisation internationale de normalisation (le W3_Consortium).
L'HTML est un format universel très flexible, riche et compact. Le HTML
natif (sans javascript) ne diffuse pas de virus et peut être lu par
n'importe quelle plate-forme. Note: Le code HTML
produit par Word est semi-propriétaire,
ce qui le rend susceptible d'inclure des informations non affichables
sur toutes les plateformes.
L'édition et mise en forme de documents
mathématiques s'appuie à un format ouvert dédié, le TeX.
- TeX, LaTeX et
Device Independent Format (DVI)
TeX est à la fois un langage de mise en forme de document et un
langage de programmation. Ecrit à l'origine pour une mise en forme
professionnelle de documents mathématiques, il est aujourd'hui utilisé
dans de nombreux autres domaines.
LaTeX est aussi un langage de mise en forme de document et de
programmation. Il s'agit en fait d'un dérivé simplifié de TeX permettant
de manipuler des instructions de haut niveau, de la même manière que le
HTML est une simplification dérivée du SGML.
DVI. Un fichier source TeX ou LaTeX a besoin d'être compilé. Le
résultat de cette compilation est au format DVI, lisible depuis
n'importe quelle plateforme. Le plus souvent, ce résultat de la
compilation sera à son tour être converti en PDF ou PS.
Si vous avez besoin de travailler de manière
collaborative sur le même texte, et vous ne pouvez pas manipuler des
fichiers HTML, une solution viable est d'utiliser un format semi-ouvert
comme le Rich Text Format.
- Rich Text Format (RTF)
Le format RTF, a été introduit par Microsoft dans le but de créer un
format standard pour le texte mis en forme. Il offre la même richesse du
format DOC, tout en étant (du moins dans sa version native) un format à
spécification publique. La plupart des logiciels de traitement de texte
sont capable d'écrire et lire ce format, mais comme certains logiciels
ont tendence à utiliser des extensions
propriétaires de ce format, sa compatibilité reste relative.
Si vous avez besoin de présenter ou imprimer documents avec une
mise en page de haute qualité, les formats PostScript (PS) et Portable
Document Format (PDF) représentent la meilleure solution disponible.
- PostScript (PS)
Le format PostScript est un langage de description de page, développé
par Adobe en 1985, déstiné à l'impression et largement utilisé dans le
domaine de la typographie. Il présente l'avantage d'être universel
(indépendant du format du fichier d'origine) et de ne pas transmettre
des virus. A l'inverse du format PDF, le PostScript ne permet pas de
copier du texte affiché à l'écran pour le coller dans une autre
application. Il peut être généré à partir d'imprimantes compatibles
(option: 'imprimer dans fichier') et avec le logiciel libre
GhostScript.
- Portable Document Format (PDF)
Le format PDF (Portable Document Format), développé par Adobe, est un
format de présentation de documents, dont la spécification
est disponible sur le web. Il s'agit d'un format universel (indépendant
de la plateforme et du logiciel utilisé pour le créer), compatible avec
toute imprimante, flexible (permet la substitution de polices, l'ajout
de liens, de signets, notes) et lisible à l'écran avec les plugins
appropriés. Il peut être généré avec Adobe Acrobat et avec le logiciel
libre GhostScript.
Les principaux formats ouverts disponibles pour les images sont
les suivants:
- Joint Photographic Expert
Group (JPEG)
Le JPEG est parmi les plus efficaces formats de compression d'images
disponibles à ce jour. Ce format ouvert très léger permet de déterminer
le taux de compression des données, sachant que plus la compression est
élevée plus la dégradation de l'image est sensible. JPEG est un procédé
de compression cumulatif : l'image se dégrade sensiblement au fur et à
mesure qu'on l'ouvre et qu'on la sauvegarde en la comprimant. Une
variante de ce format, le JPEG progressif, permet d'optimiser les délais
d'affichage de l'image sur Internet. Le nouveau standard JPEG_2000, actuellement en
phase de définition, permettra un meilleur rapport qualité/compression
aussi bien que l'indexation d'images par des mots-clé.
- Portable Network Graphics
(PNG)
Le PNG-8 et le PNG-24 sont deux formats ouverts et libres de droits.
Ils représentent la principale alternative au format GIF, spécialement
mise au point pour optimiser l'affichage des images sur internet. Ils
permettent une compression des données qui ne comporte aucune perte
d'information et ils sont supportés par la plupart des browsers. Le
poids d'un fichier PNG reste nettement plus élevé que son équivalent en
JPEG. En revanche, PNG remplacera avantageusement le GIF pour les images
8 bits et inférieures.
-
Scalable Vector Graphics (SVG)
Pour ce qui en est des formats vectoriels, un format ouvert est
disponible à la suite des travaux d'un groupe de recherche créé en 1998
par le W3_Consortium: le
Scalable Vector Graphics (SVG). Il s'agit d'un format basé sur d'autres
standards publics (XML, CSS, HTML) permettant la construction d'images
vectorielles et retaillables, idéales pour économiser la bande passante,
pour optimiser la mise en page et pour permettre de zoomer sans
dégradation de l'image. Les graphiques créés en SVG peuvent être
dynamiques et intéractifs, permettent de grouper, transformer, composer
les objets graphiques dans d'autres objets et recevoir des attributs de
style.
|
8. Liens