[Linux-bruxelles] Partitions : opération délicate... : ?s

Frederic Peters fpeters at entrouvert.be
Jeu 19 Juin 15:48:09 CEST 2003


Dans une réponse à Serge Smeeters, Ludovic Brenta écrivait:

Pour reprendre un peu sur les histoires de locales et de charsets,
profitons de Ludovic.

Le mail qu'il nous envoie spécifie ceci:

  Content-Type: text/plain; charset=utf-8
  Content-Transfer-Encoding: 8bit

Indiquant en cela qu'il est un homme moderne, soucieux de la
communication entre les peuples et (donc) utiliant le jeu de
caractères UTF-8.

Il écrit donc:

> Sinon, j'avais réussi en démarrant depuis le CD d'installation de Red
> Hat Linux 8.0; parted est dessus.

Cette phrase nous propose un caractère exotique, le «e accent aigu».
Elle nous le propose même deux fois, quel exotisme !

Pour véhiculer ce caractère, l'ordinateur de Ludovic, pour respecter
ses injonctions l'encore comme ceci: "é"  (a tilde, symbole copyright).

En effet, l'exotisme de ce caractère lui vaut 2 bytes.

La phrase de Ludovic se retrouve donc sur nos disques durs comme ceci:

  Sinon, j'avais réussi en démarrant depuis le CD d'installation de Red
  Hat Linux 8.0; parted est dessus.


Quand nos programmes de courriers électroniques, logiciels forts
évolués, liront « Content-Type: text/plain; charset=utf-8 », ils
sauront qu'ils devront afficher cette phrase avec des «e accent aigu».

Wow.  Tant de manipulations!  J'ai bien fait d'overclocker mon P4!

Précédemment, Serge, qui est un garçon très raisonnable mais ne
voulant pas prendre de risques inutiles, nous avait écrit et posait
une question en spécifiant:

  Content-Type: text/plain; charset=iso-8859-15
  Content-Transfer-Encoding: 8bit

Le jeu de caractère iso-8859-15 est une légère mise à jour de
l'iso-8859-1 (en gros, ajout de l'euro et deux/trois détails).

Ces jeux visent les langues d'Europe de l'ouest et reprennent tous les
caractères utiles à celles-ci, encodables sur un seul byte.

Donc, le «é» apparaîtra sur le disque comme cela: é.


Malheureusement, alors que tout allait bien jusqu'ici, que le charset
UTF-8 est défini dans le RFC 2279 qui doit bien avoir cinq ans, une
autre caractéristique vient tout perturber:

  User-Agent: Gnus/5.09 (Gnus v5.9.0) Emacs/21.2

Le programme de notre ami Ludovic, dans sa version 5.09 (ou 5.9, ou
21.2, tout ça est compliqué), passe complètement à côté du fait que
Serge a une autre vision du monde que lui et nous gratifie d'un:

> > Sinon, est-ce que Partition Magic peut faire ça sans perdre
> > les données (des partitions que je redimentionne où déplace) ?

en lieu et place de ce que Serge nous écrivait:

  Sinon, est-ce que Partition Magic peut faire ça sans perdre
  les données (des partitions que je redimentionne où déplace) ?


On passera rapidement sur l'hypothèse de la détection (et de la
censure par obscurcissement) de la référence à un logiciel
propriétaire par la grâce d'un éditeur codé par le représentant de la
faction «Logiciel libre - canal historique».

(oui, passons).

Essayons plutôt de voir ce qui s'est passé:

- Serge envoit un mail
- Ludovic reçoit le mail
- il décide d'y répondre
- gnus casse tout en passant par deux fois le convertisseur
  iso-8859-15 -> utf-8 sur le texte de Serge.


Tout aurait pu s'arrêter là, oui, mais gnus a décider d'égayer mon
après-midi, une fois de plus, et dans la suite du message, le texte de
Serge, certes, mais également le propre texte de Ludovic, passeront à
la dynamite gnus:

Ludovic continue donc:

> Effectivement, grub n'est pas perturbé.

Et ce n'est en effet déjà plus ça :(

Par la suite, le comportement sera cohérent avec cette dernière
phrase, cohérent et foireux.


De tout cela, que peut-on apprendre ?

 - gnus a du mal
 - mélanger des charsets, c'est pas évident
 - on était quand même bien avec l'iso-8859-1 et le franc belge

La dernière conclusion est limite, il serait mieux de la remplacer par:

 - avec le temps, tout le monde saura se débrouiller avec l'euro (euh,
   avec l'utf-8).

Et ce sera mieux.



Sincèrement,

        Frédéric





Plus d'informations sur la liste de diffusion Linux-bruxelles