CONVERT_CYR_STRING |
Conversion d'une chaine de caractères cyrillique |
PHP 4.0+ |
Syntaxe
function convert_cyr_string($str,$from,$to)
|
Paramètres
Nom |
Description |
$str |
Ce paramètre permet d'indiquer la chaine de caractères à traiter |
$from |
Ce paramètre permet d'indiquer le jeu de caractères d'origine : |
'a' |
Cette valeur permet d'indiquer un jeu «x-cp866». |
'd' |
Cette valeur permet d'indiquer un jeu «x-cp866». |
'i' |
Cette valeur permet d'indiquer un jeu «iso8859-5». |
'k' |
Cette valeur permet d'indiquer un jeu «koi8-r». |
'm' |
Cette valeur permet d'indiquer un jeu «x-mac-cyrillic». |
'w' |
Cette valeur permet d'indiquer un jeu «windows-1251». |
$to |
Ce paramètre permet d'indiquer le jeu de caractères destinataire : |
'a' |
Cette valeur permet d'indiquer un jeu «x-cp866». |
'd' |
Cette valeur permet d'indiquer un jeu «x-cp866». |
'i' |
Cette valeur permet d'indiquer un jeu «iso8859-5». |
'k' |
Cette valeur permet d'indiquer un jeu «koi8-r». |
'm' |
Cette valeur permet d'indiquer un jeu «x-mac-cyrillic». |
'w' |
Cette valeur permet d'indiquer un jeu «windows-1251». |
Retour
Valeur |
Description |
chaîne de caractères |
Ces valeurs indique une chaîne de caractères traité selon les spécifications demandé. |
Description
Cette fonction permet d'effectuer la conversion d'une chaîne de caractères ayant un jeu de caractères cyrillique vers un jeu de caractères spécifié.
Remarques
- La fonction convert_cyr_string() est dédiée aux conversions entre différents jeux de caractères cyrilliques : Elle facilite le traitement des textes écrits
en alphabet cyrillique en convertissant les chaînes selon des encodages variés, souvent utilisés dans les systèmes russes ou slaves.
- Elle prend en charge plusieurs encodages anciens et spécifiques : Parmi les jeux pris en charge figurent koi8-r, windows-1251, iso8859-5, et d'autres
encodages comme x-mac-cyrillic, étant souvent nécessaires pour assurer la compatibilité avec de vieux fichiers ou logiciels.
- Le choix du bon code source et de destination est essentiel pour éviter une corruption de données : Une mauvaise correspondance entre $from et $to peut
produire une chaîne illisible ou incorrecte, surtout lorsque des caractères spéciaux sont présents.
- Cette fonction est particulièrement utile lors de la migration de données historiques : Elle permet de normaliser des textes issus d'anciens systèmes ou
bases de données qui utilisaient des encodages non-UTF8, ce qui est encore fréquent dans certaines administrations.
- Elle ne prend pas en charge les encodages modernes comme UTF-8 : Pour les environnements récents ou multilingues, il est recommandé d'utiliser
mb_convert_encoding() ou des fonctions de la bibliothèque iconv() pour un support plus large et plus fiable.
- Le paramétrage par lettres ('a', 'k', 'w', etc.) peut paraître peu intuitif : Ce système rend le code moins lisible qu'un paramétrage explicite avec les
noms complets des encodages. Il est donc préférable d'accompagner son utilisation de commentaires pour éviter toute confusion.
- Son utilisation est désormais marginale dans les projets modernes : Avec la généralisation de l'UTF-8, la majorité des systèmes modernes n'ont plus besoin
de gérer autant d'encodages spécifiques au cyrillique, ce qui réduit le recours à cette fonction.
- Malgré son ancienneté, elle reste utile pour des projets de rétrocompatibilité : Lorsqu'il s'agit de traiter d'anciens contenus russes ou ukrainiens, ou de
maintenir des logiciels hérités, convert_cyr_string() peut s'avérer irremplaçable sans recoder toute la logique de conversion.
Références
PHP 4 - Guide du développeur, Edition First Interactive, Blake Schwendiman, 2002, ISBN: 2-84427-283-5, page 381
Dernière mise à jour : Mercredi, le 25 mars 2015