Syntaxe
unicode(object)
|
unicode(object, encoding)
|
unicode(object, encoding, errors)
|
Paramètres
Nom |
Description |
object |
Ce paramètre permet d'indiquer l'objet à convertir en chaîne de caractères. |
encoding |
Ce paramètre optionnel permet d'indiquer la chaîne de caractères encodé. |
errors |
Ce paramètre optionnel permet d'indiquer la manière qu'il faut gérer les erreurs. |
Description
Cette fonction permet de retourner une version de chaîne de caractères Unicode de l'objet.
Remarques
- Si un codage et/ou des erreurs sont donnés, la fonction unicode() décodera l'objet pouvant être soit une chaîne de caractères de 8 bits, soit un tampon de caractères utilisant le
codec pour le codage. Le paramètre encoding est une chaîne de caractères donnant le nom d'un encodage; si le codage n'est pas connu, l'exception LookupError est
déclenchée. La gestion des erreurs se fait en fonction du paramètre errors; ce paramètre spécifie le traitement des caractères non valides dans le codage d'entrée.
Si les erreurs sont 'strict' (c'est la valeur par défaut), une erreur ValueError est déclenchée sur les erreurs, tandis qu'une valeur 'ignore' fait en sorte que
les erreurs sont silencieusement ignorées, et une valeur 'replace' provoque le caractère de remplacement Unicode officiel, U+FFFD, à utiliser pour remplacer les caractères
saisis ne pouvant pas être décodés. Voir devriez également consulter le module codecs pour des situations plus personnalisés.
- Si aucun paramètre facultatif n'est donné, la fonction unicode() imitera le comportement de la fonction str() sauf qu'il renvoie des chaînes
de caractères Unicode au lieu de chaînes de caractères 8 bits. Plus précisément, si l'objet est une chaîne de caractères ou une sous-classe Unicode, il retournera cette
chaîne de caractères Unicode sans aucun décodage supplémentaire appliqué.
- Pour les objets fournissant une méthode __unicode__(), il appellera cette méthode sans paramètres pour créer une chaîne de caractères Unicode. Pour tous les autres
objets, la version ou la représentation de chaîne de caractères 8 bits est demandée, puis convertie en chaîne de caractères Unicode en utilisant le codec pour l'encodage
par défaut en mode «strict».
Dernière mise à jour : Mercredi, le 14 septembre 2016