[Java lista] Reguláris kifejezés
Levi
levpista at freemail.hu
2007. Nov. 27., K, 13:57:01 CET
Sziasztok!
Nézzétek már meg légyszi ezt a kifejezést, mert valami nem oké vele.
Egy HTML oldalról szeretnék adatokat kinyerni.
Jelen esetben a TITLE tag értékét szeretném megkapni (<title>...</title>).
Először PHP-ben írtam meg, ami teljesen jól működik:
// $html itt, a html oldal maga
$pattern = "/<title(?:\s(?:'[^']*'|"[^"]*"|[^'">])*){0,1}>((?:[^<]|<(?!\/title>))*)<\/title>/iX";
$title = preg_match($pattern, $html, $title) ? $title[1] : '';
Gondoltam java-ra sem lesz nehezebb implementálni:
/* Az inputStr itt, a html oldal maga */
boolean result;
String patternStr = "/<title(?:\s(?:'[^']*'|"[^"]*"|[^'">])*){0,1}>((?:[^<]|<(?!\/title>))*)<\/title>/iX";
Pattern pattern = Pattern.compile(patternStr);
Matcher matcher = pattern.matcher(inputStr);
result = matcher.find();
Érdekes módon a java nem talált egyezést, míg a php simán kidobta az eredményt.
Van valami ötletetek?
Üdv,
Levi
iWiW Kötelező Biztosítás 2008! Ingyenes asszisztencia, és akár 48%-os kedvezmény!
________________________________________________________
http://cthandler.adverticum.net/?cturl=http%3A%2F%2Fwww.iwiw.hu%2Fpages%2Fmisc%2Finsurance.jsp%3Fiwiw_bizt
--------- következő rész ---------
Egy csatolt HTML állomány át lett konvertálva...
URL: http://javagrund.hu/pipermail/javalist/attachments/20071127/956e9f30/attachment-0001.html
További információk a(z) Javalist levelezőlistáról