Wed, 09 Aug 2006 13:59:52 +0200

jnak <kanknuj@index.hu>

utf-8 - multilanguage - nem 100%-ig java




Sziasztok,

napok ota szivok a tobbnyelvuseggel.

Azt szeretnem elerni, hogy a requestURI -ban is lehessenek ekezetek.
megkulonboztetek 3 fele "lekerest".

- url sorban kezzel bepotyogve ( elvileg ilyenkor a bongeszo 
alapertelmezett kodolasat/nyelvet felhasznalva tortenik az enkodolas)
- adott oldalon kattintva a linkre ( az oldal karaketerkodolasa + 
bongeszo altal ismert kodolasok)
- GET/POST formon (parameteratadas - itt meg aztan minden)

Mivel a legkezenfekvobb megoldast az UTF-8, igy erre is terveztem az 
egeszet, felhasznalva a valaszlevel  tartalmat (lent).
mukodik is, IE-ben es OPERA-ban.
teljesen mindegy mit allitok be accept-language-nak es 
accept-charsetnek, ez a ketto mindig UTF-8-ban kuldi el a karaktereket, pl:

domain.com/éáöõüúóûÍ

ekezethelyes mind a kettoben, + cimsorban nem encodolja, megmaradnak az 
ekezetek.

a gepemen 1.0-as FF van, ez ugy viselkedik mint a mask ketto, bar a 
cimsorban mar dekodolja a karaketereket, igy jo csunya %-os requestURI-t 
latok magam elott.



A LENYEG:

jon a FIREFOX 1.5

teljesen mindegy mit allitok be neki accept-languagenak, s 
accept-charsetnek, ez mindig ISO-8859-2-vel kuldi el.
valoszinuleg azert mert magyar xp-ken teszteltunk, az en gepem angol 
nyelvu, itt mukodik.


pl a hosszu u"
- FF v1.5 - magyar XP ---> %FB
- FF v1.0 - angol XP ---->  %C5%B1
- OPERA v.7.54 - angol XP ---->  %C5%B1
- IE v6.0.29 - angol XP ---->  %C5%B1
- IE v6.0.29 - magyar XP ---->  %C5%B1


egy korabbi level alapjan beallitottam mindent UTF-8-ra.

"" {
 
 Tehát 4 helyen kell beállítani:
 1) filter -> request
 2) response
 3) html meta tag
 4) form accept charset

+ 5) server.xml URIEncoding="UTF-8"

} ""

kiszedtem a server.xml-bol az UTF-8-at ---> maradt minden eredetiben,
atirtam a server.xml-ben ISO-8859-2-re ----> maradt minden eredetiben

fejleceket, mindent atirok ISO-8859-2-re, marad minden rosszul.

beallitom, hogy


domain.com:8082/&#47;&#233;&#225;&#246;&#337;&#252;&#250;&#243;&#369;

rakattintok, jo lesz FF v1.5-ben is.

(vagyis tenyleg a OS alapertelmezett nyelve miatt lesz ISO-8859-2)


KERDES:

Honnan tudom eldonteni, hogy adott adott url kodolas milyen 
karaktertabla szerint tortent?

Azt meg tudom csinalni, hogy ip cim alapjan pontosan behatarolom az 
illeto orszagat, nyelvet, de az sem tokeletes megoldas, mert pl egy 
usa-beli magyarnak rossz lesz az outputja.



_minden_ hozzaszolast halasan koszonok!

udv, t