Le codage des caractères

L'affichage des caractères typiques des autres langues ainsi que l'affichage des caractères spéciaux joue un rôle assez important dans l'optimisation des pages Web pour le référencement. Le problème est surtout qu'un Webmaster ne peut pas découvrir les problèmes occasionnés dans son propre ordinateur. Les moteurs de recherche et surtout leurs algorithmes, par contre, découvrent un problème d'affichage immédiatement. Il y en a de robots qui ne sont même capable à déchiffrer les mots clés d'une page si les caractères ne soient pas correctement codés.

Les metas d'une page et les caractères

Dès qu'un Webmaster utilise des caractères non inclus dans la norme ASCII il doit en informer les moteurs de recherche, les validateurs ainsi que le navigateurs de ce fait et ajouter cette information dans les Metas du head de la page concernée.
 
Pour garantir l'affichage correct dans tous les navigateurs, le Webmaster se sert de la norme ISO qui propose plusieurs sets de caractères. Pour la langue Française il suffit la norme ISO-8859-1 qui couvre la majorité des langues occidentales. Mais si le contenu d'une page contient de caractères en serbe, bulgare ou polonais, cette norme ne suffit plus. Le même problème surgit en utilisant la norme UTF-8 ou autre.
 
En respectant la compatibilité descendant des navigateurs, un Webmaster qui programme en xhtml ou xml, géré par un langage script comme PHP ou non, doit en plus du code xhtml ajouter plusieurs lignes dans les metas pour que le code soit aussi lisible pour les navigateurs qui se limitent à lire de codes HTML.

Caractères des langues étrangers

Il est toutefois évident que les caractères de diverses langues du monde n'ont pas seulement besoin d'une "information" dans les metas. Chaque caractère étranger a besoin d'un propre code dans le texte du document, conforme à la norme ISO correspondant. Chaque Webmaster a donc besoin de ces codes standards à côte ou dans son ordinateur pour que les caractères soient affichés correctement partout dans le monde.
 
Le codage des caractères devient encore plus important si le Webmaster utilise un langage dynamique comme PHP, JavaScript, ASP ou JSP pour créer ses pages ou s'il ajoute des pages qui envoient des mails automatiques. Si les internautes reçoivent des textes quasiment illisibles, manque de codage ou manque de metas, la réputation d'une entreprise est vite détruite et les visiteurs du site disparaissent. Avec la disparition des internautes, la page disparaît également des premières pages des moteurs de recherche.

Caractères spéciaux

Le problème d'affichage se complique encore plus si une page a besoin des caractères spéciaux de la mathématique, de la physique ou de la chimie. Un grand nombre de ces caractères est couvert par une des normes ISO et nécessite donc pas plus que les indications meta et du code du caractère correspondent.
 
Pour affiches d'autres caractères spéciaux il n'y a qu'une seule possibilité : utiliser des images complétées par leurs attributs et valeurs qui expliquent le "contenu" de chaque image aussi précisément que possible.
 
Les liens suivant propose des informations complémentaires sur les questions des caractères :
Charset et encoding
Les caractères spéciaux
Unicode and Character Sets