[Java lista] Mit jelent a szó - Unicode - ne keverjük - RE: String karakter konverzio
Zoltan Mozes
Zoltan_Mozes at epam.com
2006. Nov. 24., P, 14:39:38 CET
Hahó, álljunk meg, tisztázzunk valamit rögtön az elején.
Mindenki vagdalkozik ezzel a szóval hogy "unicode". Csak azt felejtjük el itt mindnyájan, hogy ez (csak) egy absztrakt eljárás, - az hogy 256nál több féle karaktert is megkülönböztetünk "ezt jelenti a szó: Unicode") amit konkrétan legalább 99féleképp lehet implementálni. (leképezni - pl UTF8 vagy UTF16)
A 2 legelterjedtebb Unicode leképezés
- UTF8 és az (8 illetve eseteknént több bájton képezzük le a 65535 kakakteres értékkészletet)
- UTF16. (mindig 16 bájton képezzük le)
>> Hallo,halló, álljunk már meg egy kicsit. Mi az hogy egy String UTF-8-as? Vagy Win1250? A string unicode karakterek lánca.
JVMben ahogy én tudom 16 biten tárolódik minden char. (2byte), tehát - javítsatok ki, de - a következő a pontosabb meghatározás:
"A string 16 biten ábrázolt (ezáltal megvalósított Unicode karakterkészletből választott) karakterek lánca."
Magyarul JVMen belül UTF8ról beszélni hullakemény dolog, de oszlassátok el a félreértésemet ha tévedek.
"Inside the JVM, text is represented by 16-bit Unicode. In files, some text is represented by
UTF, which translates directly to Unicode. Other text is represented by old-style 8-bit
encodings; Readers and Writers translate between these encodings and 16-bit Unicode."
"Programs may use UTF to read and write Unicode.
_
Programs may use readers and writers to convert between internal Unicode and external
8-bit encodings."
Complete Java(r) 2
Certification: Study Guide,
Fifth Edition
Philip Heller
Simon Roberts
SYBEX(r)
--------- következő rész ---------
Egy csatolt HTML állomány át lett konvertálva...
URL: http://javagrund.hu/pipermail/javalist/attachments/20061124/16c31476/attachment.html
További információk a(z) Javalist levelezőlistáról