[Java lista] HTTP header parser regex-el

Levi levpista at freemail.hu
2008. Nov. 25., K, 12:22:10 CET


Sziasztok!
Szeretném megtudni egy oldalról, hogy milyen karakterkódolású.
A headert lekérem, lsd:

    public static String getHTTPCharset(URL url) throws Exception
    {
        String result = null;
        //String pcharset = "charset=";
        try 
        {    
            URLConnection c = url.openConnection();
    
            for (int i = 0; ; i++) 
            {
                String name = c.getHeaderFieldKey(i);
                String value = c.getHeaderField(i);
    
                if (name == null && value == null) // header vége
                {
                    break;         
                }

                if (name != null)
                {
                    //ide kellene vmi parser vagy matcher...

                     //result = value;
                    //System.out.println(name + "=" + value);
                }
            }
        } 
        catch (Exception e) { result = null; }
        
        return result;
    }

Szeretném valami elegáns pattern segítségével megoldani. 
A charset értéke a ciklusban a value változóba kerül ilyen formán: "text/html; charset=UTF-8"
Ebből a stringből szeretném kinyerni és visszaadni az "UTF-8"-at vagy éppen amilyen kódolású az oldal.
Tudnátok erre egy reguláris kifejezést használó megoldást adni?

Üdv,
Levi




______________________________________________________________________
Tesz-vesz Város karácsonyi akciója 30% kedvezménnyel!
http://bookline.hu/sortlist/sortlist.action?id=3481&tabname=book&affiliate=frescrkar7018
--------- következő rész ---------
Egy csatolt HTML állomány át lett konvertálva...
URL: http://javagrund.hu/pipermail/javalist/attachments/20081125/141fc264/attachment.html 


További információk a(z) Javalist levelezőlistáról