[Java lista] Fwd: Reguláris kifejezés

Levi levpista at freemail.hu
2007. Nov. 29., Cs, 17:47:40 CET


Köszi mindenkinek az értékes hozzászólását!
A hiba, a /.../ típusú módosító használatánál volt.

Levi



---------- Eredeti üzenet ----------
Dátum: 2007. nov. 27. Kedd 13:57:01
Feladó: Levi <levpista at freemail.hu>

Címzett: javalist at javagrund.hu

Tárgy: Reguláris kifejezés


Sziasztok!

Nézzétek már meg légyszi ezt a kifejezést, mert valami nem oké vele.
Egy HTML oldalról szeretnék adatokat kinyerni.
Jelen esetben a TITLE tag értékét szeretném megkapni (<title>...</title>).
Először PHP-ben írtam meg, ami teljesen jól működik:
    // $html itt, a html oldal maga
    $pattern = "/<title(?:\s(?:'[^']*'|"[^"]*"|[^'">])*){0,1}>((?:[^<]|<(?!\/title>))*)<\/title>/iX";
    $title = preg_match($pattern, $html, $title) ? $title[1] : '';

Gondoltam java-ra sem lesz nehezebb implementálni:
    /* Az inputStr itt, a html oldal maga */
    boolean result;
    String patternStr = "/<title(?:\s(?:'[^']*'|"[^"]*"|[^'">])*){0,1}>((?:[^<]|<(?!\/title>))*)<\/title>/iX";
    Pattern pattern = Pattern.compile(patternStr);        
    Matcher matcher = pattern.matcher(inputStr);
    result = matcher.find();

Érdekes módon a java nem talált egyezést, míg a php simán kidobta az eredményt.

Van valami ötletetek?

Üdv,
Levi
 

____________________________________________________________
iWiW Kötelező Biztosítás 2008! Ingyenes asszisztencia, és akár 48%-os kedvezmény!  


SMS-ÉRTESÍTŐ - Fontos levelet vársz? Nem kell folyamatosan a gép elött ülnöd!
________________________________________________________
http://www.freemail.hu

--------- következő rész ---------
Egy csatolt HTML állomány át lett konvertálva...
URL: http://javagrund.hu/pipermail/javalist/attachments/20071129/151288ed/attachment-0001.html 


További információk a(z) Javalist levelezőlistáról