Noms de domaine accentués : fausse bonne idée ?

mercredi 8 février 2012

L'AFNIC, association gérant les noms de domaine .fr, vient d'annoncer l'ouverture prochaine des enregistrements de noms de domaine contenant des lettres accentuées. Cela semble être une bonne idée, mais en pratique, les inconvénients risquent d'être plus nombreux que les avantages.

L’AFNIC, association gérant les noms de domaine .fr, vient d’annoncer l’ouverture prochaine des enregistrements de noms de domaine contenant des lettres accentuées. Cela semble être une bonne idée, mais en pratique, les inconvénients risquent d’être plus nombreux que les avantages.

Principe

Le noms de domaine en .fr, notamment, pourront bientôt contenir les lettres accentuées suivantes :

ß, à, á, â, ã, ä, å, æ, ç, è, é, ê, ë, ì, í, î, ï, ñ, ò, ó, ô, õ, ö, ù, ú, û, ü, ý, ÿ, oe

Avantages

Le site domaineinfos.fr donne quelques exemples de l’utilité d’une telle mesure :

Plus de contrainte liée à l’utilisation du code ASCII, ce code qui n’autorise que les caractères latins non accentués, les chiffres de 0 à 9 et le tiret ; plus de confusion entre «marche» et «marché», «pêche» et «péché»…

En effet, l’introduction des accents dans les noms de domaine permet d’éviter quelques confusions, comme de se retrouver sur un site de randonnée alors qu’on cherche à faire ses courses. Cela dit, de telles confusions sont rares, car les noms de domaine représentent plus souvent des marques ou de sigles que des noms communs. Mais c’est tout de même un avantage.

Et puis il y a l’amour de la langue française, pour ceux qui pensent qu’elle est plus qu’un simple outil pour communiquer. Nous retrouverons nos «vrais» mots avec leurs accents. Le Web sera ainsi un peu moins anglophone, et un peu plus francophone.

Inconvénients

Malgré ces quelques avantages, les inconvénients sont nombreux et importants. Avant de les présenter, précisons qu’ils ont une variante active et une autre passive : s’il est difficile pour l’utilisateur de visiter un site Web avec un nom de domaine accentué (inconvénient actif), la visibilité de ce site est réduite, ce qui porte préjudice à son auteur (inconvénient passif).

Le premier inconvénient est tellement évident et grave (pour ne pas dire rédhibitoire) qu’il aurait dû faire échec, à notre sens, à l’introduction des accents dans les noms de domaine : tous les claviers ont toutes les lettres non accentuées de l’alphabet latin, mais tous les claviers n’ont pas toutes les lettres accentuées, ou certaines lettres de l’alphabet latin étendu comme le ß allemand.

Comment, par exemple, accéder au site straße.fr avec un ordinateur doté d’un clavier français (azerty) ? La lettre ß n’est pas présente sur le clavier, il faut donc trouver un autre moyen de l’insérer. Il existe 3 méthodes :

Première méthode: insérer la lettre à l’aide de son code ASCII. Sous Windows, il faudra ainsi taper Alt+0223 pour insérer ß. Cette méthode présente plusieurs inconvénients :

  • Il faut connaître cette possibilité. Il est peu probable que les non informaticiens la connaissent.
  • Cela ne fonctionnera pas forcément avec les autres systèmes d'exploitation que Windows (Mac, Linux), et encore moins avec les systèmes pour tablette ou smartphone (Android, iOS, etc.).
  • En outre, il faut connaître le code ASCII de la lettre que l'on veut insérer. Effectuer une recherche sur Google chaque fois que l'on veut accéder à un site Web, cela n'est pas envisageable !

Deuxième méthode: utiliser un moyen logiciel local. Cette méthode est bien connue des utilisateurs de Mac : il s’agit d’ouvrir une petite fenêtre, appelée «Caractères spéciaux», contenant une liste de caractères, puis de choisir un caractère dans la liste et de double-cliquer dessus pour l’insérer à l’endroit où se trouve le curseur. De l’ouverture de la fenêtre à l’insertion du caractère, en passant par sa recherche dans la liste, il faut bien compter entre 10 et 15 secondes… contre une fraction de seconde seulement pour taper une lettre présente sur le clavier ! Clairement, cette méthode n’est pas valable sur le long terme.

Troisième méthode: copier le caractère accentué, puis le coller dans la barre d’adresse du navigateur. C’est sans doute la méthode la plus intuitive, que la plupart des gens utiliseront. Elle présente cependant deux inconvénients :

  • il faut posséder une source depuis laquelle copier la lettre ;
  • il faut que le logiciel dans lequel l'on colle la lettre reconnaisse son encodage.

Le deuxième inconvénient provient de la gestion des lettres accentuées et autres caractères spéciaux par les systèmes informatiques actuels. Un «é» n’est pas un «e» sur lequel l’on aurait ajouté un accent, mais une lettre à part entière. Il existe donc des «tables» de caractères (charset) qui contiennent certaines lettres accentuées et certains caractères spéciaux, et qui ne sont pas compatibles les unes avec les autres. Un texte doit donc être «encodé» grâce à l’une ou l’autre de ces tables.

Cet inconvénient touche principalement les développeurs des logiciels qui utilisent les noms de domaine (entre autres, les navigateurs). Ces logiciels devront manipuler les différents encodages et savoir reconnaître et convertir les caractères. Présenté de cette manière, cela peut semble simple, mais la réalité est bien différente. Les problèmes d’encodages sont en effet récurrents et souvent très difficiles à traiter, car de nombreux développeurs anglophones «oublient» que tout le monde n’utilise pas l’alphabet anglais et ne prévoient aucun mécanisme de gestion des charsets internationaux.

En pratique, il y aura donc très probablement des difficultés :

  • lors de la communication par écrit d'une adresse, dans un fichier de texte ou dans un e-mail, par exemple ;
  • lors des copier/coller d'un document à l'autre ou d'un logiciel à l'autre.

Le troisième inconvénient découle des deux premiers : il deviendra difficile pour l’utilisateur lambda d’écrire certaines adresses ; il aura donc recours à des moyens détournés ; le principal d’entre-eux sera probablement d’écrire le mot sans accent ou caractère spécial dans le champ de recherche de Google, afin que le moteur de recherche corrige l’adresse automatiquement. Cela est problématique à deux titres :

  • d'abord, c'est une étape supplémentaire, qui représente une perte de temps ;
  • ensuite et surtout, laisser un moteur de recherche (un logiciel tiers, propriétaire) suggérer quels sites devraient être visités est une mauvaise habitude à ne pas prendre ; c'est en effet lui donner un trop grand pouvoir.

Le quatrième inconvénient est l’augmentation des risques de confusion entre différents noms de domaine. Nous disions que l’introduction des accents avait le mérite de réduire la confusion, par exemple entre «marche.fr» et «marché.fr». Mais imaginons que l’on vous dise, à l’oral, d’aller visiter ce site. Où irez-vous : «marché.fr», «marcher.fr», «marchez.fr» ? La confusion existait déjà (er/ez), mais une nouvelle source s’y ajoute.

Effet corollaire de la confusion, le cybersquatting (ou typosquatting). S’il existe un risque de confusion, il faut être sûr que certaines personnes mal intentionnées l’exploiteront. L’AFNIC prévoit de filtrer, dans une premier temps, les dépôts de noms de domaine avec des caractères accentués et de donner la priorité aux demandeurs qui possèdent le nom de domaine sans accent. Mais une fois cette période passée, la règle du «premier arrivé, premier servi» s’appliquera à nouveau. La conséquence de cela est que les sociétés souhaitant protéger leur image ou leurs marques devront réserver beaucoup plus de noms de domaine : le mot sans accents, et ses différentes variantes avec accents et caractères spéciaux.

Face à toutes ces difficultés, l’introduction des caractères spéciaux dans les noms de domaine semble être une fausse bonne idée, d’autant que les avantages d’une telle mesure semblent dérisoires. Il aurait sans doute été plus opportun d’attendre que les évolutions technologiques résolvent d’elles mêmes la plupart des difficultés (par exemple, lorsqu’on pourra parler à son ordinateur, lui dicter l’adresse, l’absence des caractères accentués sur le clavier ne posera plus problème).