[Java lista] Reguláris kifejezés

Levi levpista at freemail.hu
2007. Nov. 27., K, 13:57:01 CET


Sziasztok!

Nézzétek már meg légyszi ezt a kifejezést, mert valami nem oké vele.
Egy HTML oldalról szeretnék adatokat kinyerni.
Jelen esetben a TITLE tag értékét szeretném megkapni (<title>...</title>).
Először PHP-ben írtam meg, ami teljesen jól működik:
    // $html itt, a html oldal maga
    $pattern = "/<title(?:\s(?:'[^']*'|"[^"]*"|[^'">])*){0,1}>((?:[^<]|<(?!\/title>))*)<\/title>/iX";
    $title = preg_match($pattern, $html, $title) ? $title[1] : '';

Gondoltam java-ra sem lesz nehezebb implementálni:
    /* Az inputStr itt, a html oldal maga */
    boolean result;
    String patternStr = "/<title(?:\s(?:'[^']*'|"[^"]*"|[^'">])*){0,1}>((?:[^<]|<(?!\/title>))*)<\/title>/iX";
    Pattern pattern = Pattern.compile(patternStr);        
    Matcher matcher = pattern.matcher(inputStr);
    result = matcher.find();

Érdekes módon a java nem talált egyezést, míg a php simán kidobta az eredményt.

Van valami ötletetek?

Üdv,
Levi


iWiW Kötelező Biztosítás 2008! Ingyenes asszisztencia, és akár 48%-os kedvezmény!
________________________________________________________
http://cthandler.adverticum.net/?cturl=http%3A%2F%2Fwww.iwiw.hu%2Fpages%2Fmisc%2Finsurance.jsp%3Fiwiw_bizt
--------- következő rész ---------
Egy csatolt HTML állomány át lett konvertálva...
URL: http://javagrund.hu/pipermail/javalist/attachments/20071127/956e9f30/attachment-0001.html 


További információk a(z) Javalist levelezőlistáról