[Java lista] HTTP header parser regex-el
Levi
levpista at freemail.hu
2008. Nov. 25., K, 12:22:10 CET
Sziasztok!
Szeretném megtudni egy oldalról, hogy milyen karakterkódolású.
A headert lekérem, lsd:
public static String getHTTPCharset(URL url) throws Exception
{
String result = null;
//String pcharset = "charset=";
try
{
URLConnection c = url.openConnection();
for (int i = 0; ; i++)
{
String name = c.getHeaderFieldKey(i);
String value = c.getHeaderField(i);
if (name == null && value == null) // header vége
{
break;
}
if (name != null)
{
//ide kellene vmi parser vagy matcher...
//result = value;
//System.out.println(name + "=" + value);
}
}
}
catch (Exception e) { result = null; }
return result;
}
Szeretném valami elegáns pattern segítségével megoldani.
A charset értéke a ciklusban a value változóba kerül ilyen formán: "text/html; charset=UTF-8"
Ebből a stringből szeretném kinyerni és visszaadni az "UTF-8"-at vagy éppen amilyen kódolású az oldal.
Tudnátok erre egy reguláris kifejezést használó megoldást adni?
Üdv,
Levi
______________________________________________________________________
Tesz-vesz Város karácsonyi akciója 30% kedvezménnyel!
http://bookline.hu/sortlist/sortlist.action?id=3481&tabname=book&affiliate=frescrkar7018
--------- következő rész ---------
Egy csatolt HTML állomány át lett konvertálva...
URL: http://javagrund.hu/pipermail/javalist/attachments/20081125/141fc264/attachment.html
További információk a(z) Javalist levelezőlistáról