Inversion of codings of ASCII and UTF-8 characters

Cette page encodée en ANSI/ASCII (charset=Windows-1252) a été correctement interprétée par le navigateur en charset=Windows-1252: ASCII Western European (Windows-1252).
Affichage du caractère éMnémoniqueCause d'Erreur
éUTF-8 => ASCIIPage stockée en fichier local en format Unicode UTF-8 interprétée par erreur en ASCII
ASCII => UTF-8Page stockée en fichier local en format ASCII interprétée par erreur en Unicode UTF-8

Quand une page est stockée dans le serveur en format Unicode UTF-8, mais affichée dans le navigateur par erreur en mode de caractère uni-octet, abusivement appelé ASCII, ie, en charset=windows-1252, ce caractère Unicode UTF-8 prend deux places.

Essayez le caractère é Unicode: il est doublé en é

Il était une fois dans l'Ouest de la Chine... il faisait froid en hiver.

   

Photos No Photos  | Avanced
Search All Categories
Write Chinese Online
+Input ChineseI would like search products with Chinese Names, so I input Chinese Ideograms, so I click here.+

Au contraire si votre page est stockée dans le serveur web en format ANSI/ASCII, mais affichée dans le navigateur du client par erreur en mode de caractère multi-octet UTF-8, appelé Unicode, en mode Unicode UTF-8, ie, en charset=UTF-8, ce caractère ASCII devient plus mince encore pour devenir un diamant point d'interrogation ou carr vide, comme s'il n'est pas assez costaud pour occuper même une seule place dans le monde Unicode qui est multi-octet.

En rgle gnrale, quand votre fichier est en codage plus petit, plus maigre que le codage du navigateur l'affichage, le diamant point d'interrogation ou carr vide � apparat.

Essayez le caractère é ASCII: il est réduit en diamant point d'interrogation ou carr vide �.

Il �tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.

Il est utile de prciser que tous les caractres ASCII du code 0 127 gardent toujours les mmes codes sans changement quelque soit le codage des caractres, ASCII, GBK, Unicode...

Tous les caractres ASCII tendus du code 0 255 (2**8=256, uni-octet, mono-byte) peuvent tre stocks soit dans un fichier ASCII, soit en format Unicode UTF-8. Le contraire n'est pas vrai, les caractres multi-octet (multi-byte) avec un code suprieur ou gal 256, qui ne peuvent tre conservs que dans un fichier Unicode comme UTF-8, ou bien dans un format spcifique (code page pays) tel le GBK pour les idogrammes chinois.

Sur le web, un caractre Unicode peut en outre s'exprimer en code entit HTML, ainsi stock dans un fichier du codage ASCII. Par exemple, l'idogramme 语 signifiant Langue, peut tre stock en mode ASCII par la chane 语, compose uniquement des ampersand &, dise #, suivi par des chiffres du numro dcimal de ce caractre en Unicode, et termin par un point-virgule ;.

Citation de Mao pour tester:

中国应对人类作出较大的贡献!

La Chine doit faire une contribution relativement grande l''Humanit!

ويتعين على الصين تقديم اسهامات اكبر للبشرية!

Китай должен сделать больший вклад в человечество!

Κίνα θα πρέπει να συμβάλει περισσότερο στην ανθρωπότητα!

中国は人類に大きな貢献をしてください!

בסין יש תרומה גדולה לאנושות!

चीन मानव जाति के लिए एक बड़ा योगदान करना चाहिए!

จีนควรจะให้มีส่วนร่วมมากขึ้นเพื่อมนุษยชาติ!

چین باید سهم بیشتری به انسان را!

China shall make a relatively great contribution to the Man Kind!

Cette page est stocke dans le disque dur en format ANSI/ASCII. Mais je vous propose de l'afficher en diffrents codages. Elle peut devenir illisible si le codage diffre trop. Il faut revenir en ASCII si vous avez mal la tte. Testez vous-mme sur votre navigateur en cliquant sur les liens suivants:

[Auto Detection] (auto) | Arabic (ISO-8859-6) | Arabic (Windows-1256) | ASCII Western European (ISO-8859-1) | ASCII Western European (Windows-1252) | Baltic (ISO-8859-4) | Baltic (Windows-1257) | Central European (Windows-1250) | Chinese Simplified (GB18030) | Chinese Simplified (GB2312) | Chinese Simplified (GBK) | Chinese Simplified (HZ) | Chinese Traditional (Big5) | Cyrillic (ISO-8859-5) | Cyrillic (KOI8-R) | Cyrillic (KOI8-U) | Cyrillic (Windows-1251) | Greek (Windows-1253) | Hebrew (Windows-1255) | Hebrew (ISO-8859-8-l) | Celtic (ISO-8859-14) | Central European (ISO-8859-2) | Estonian (ISO-8859-13) | Greek (ISO-8859-7) | Hebrew (ISO-8859-8) | Japanese (EUC-JP) | Japanese (ISO-2022-JP) | Japanese (Shift_JIS) | Korean (EUC-KR) | Latin 9 (ISO-8859-15) | Nordic (ISO-8859-10) | Roumain (ISO-8859-16) | South European (ISO-8859-3) | Thai (TIS-620) | Turkish (ISO-8859-9) | Turkish (Windows-1254) | Unicode (UTF-16LE) | Unicode (UTF-8) | Vietnamese (Windows-1258).

jinCurrencies | zhongClock | yiTranslation | ciDictionaries | xieWriting | zhuanEncode

Give us feedback (0)

Add URL |
No user notes yet.
Your comment:
Email
Web

Or sign in:
Who?

Please copy the string:
String to be copied in the box at the right that is case-sensitive. This pain is necessary after receiving thousands of messages generated automatically per day.

Asia Home™ > Tools > Inversion of codings of ASCII and UTF-8 characters | General Sales Conditions | Returns and refunding | Privacy Policy | FAQ | Google+
  

Want to come? | Call us 7/700 33 467 790 487 (no surcharge)

Popup Window    Close
Patience please...