[Java lista] Mit jelent a szó - Unicode - ne keverjük - RE: String karakter konverzio

Zoltan Mozes Zoltan_Mozes at epam.com
2006. Nov. 24., P, 14:39:38 CET


Hahó, álljunk meg, tisztázzunk valamit rögtön az elején.

 

Mindenki vagdalkozik ezzel a szóval hogy "unicode". Csak azt felejtjük el itt mindnyájan, hogy ez (csak) egy absztrakt eljárás, - az hogy 256nál több féle karaktert is megkülönböztetünk "ezt jelenti  a szó: Unicode") amit konkrétan legalább 99féleképp lehet implementálni. (leképezni - pl UTF8 vagy UTF16)

A 2 legelterjedtebb Unicode leképezés

-         UTF8 és az (8 illetve eseteknént több bájton képezzük le a 65535 kakakteres értékkészletet)

-         UTF16. (mindig 16 bájton képezzük le)


>> Hallo,halló, álljunk már meg egy kicsit. Mi az hogy egy String UTF-8-as? Vagy Win1250? A string unicode karakterek lánca. 



JVMben ahogy én tudom 16 biten tárolódik minden char. (2byte), tehát - javítsatok ki, de - a következő a pontosabb meghatározás:

"A string 16 biten ábrázolt (ezáltal megvalósított Unicode karakterkészletből választott) karakterek lánca." 

 

Magyarul JVMen belül UTF8ról beszélni hullakemény dolog, de oszlassátok el a félreértésemet ha tévedek.

 

"Inside the JVM, text is represented by 16-bit Unicode. In files, some text is represented by

UTF, which translates directly to Unicode. Other text is represented by old-style 8-bit

encodings; Readers and Writers translate between these encodings and 16-bit Unicode." 

 

"Programs may use UTF to read and write Unicode.

_

Programs may use readers and writers to convert between internal Unicode and external

8-bit encodings."

 

 

Complete Java(r) 2

Certification: Study Guide,

Fifth Edition

Philip Heller

Simon Roberts

SYBEX(r)

 

 

 

--------- következő rész ---------
Egy csatolt HTML állomány át lett konvertálva...
URL: http://javagrund.hu/pipermail/javalist/attachments/20061124/16c31476/attachment.html 


További információk a(z) Javalist levelezőlistáról