[Java lista] Reguláris kifejezés

Zsombor gzsombor at gmail.com
2007. Nov. 27., K, 14:07:36 CET


On 11/27/07, Levi <levpista at freemail.hu> wrote:
>
> Sziasztok!
>
> Nézzétek már meg légyszi ezt a kifejezést, mert valami nem oké vele.
> Egy HTML oldalról szeretnék adatokat kinyerni.
> Jelen esetben a TITLE tag értékét szeretném megkapni (<title>...</title>).
> Először PHP-ben írtam meg, ami teljesen jól működik:
>     // $html itt, a html oldal maga
>     $pattern =
> "/<title(?:\s(?:'[^']*'|"[^"]*"|[^'">])*){0,1}>((?:[^<]|<(?!\/title>))*)<\/title>/iX";
>     $title = preg_match($pattern, $html, $title) ? $title[1] : '';
>
> Gondoltam java-ra sem lesz nehezebb implementálni:
>     /* Az inputStr itt, a html oldal maga */
>     boolean result;
>     String patternStr =
> "/<title(?:\s(?:'[^']*'|"[^"]*"|[^'">])*){0,1}>((?:[^<]|<(?!\/title>))*)<\/title>/iX";
>     Pattern pattern = Pattern.compile(patternStr);
>     Matcher matcher = pattern.matcher(inputStr);
>     result = matcher.find();
>
> Érdekes módon a java nem talált egyezést, míg a php simán kidobta az
> eredményt.
>
> Van valami ötletetek?
>
> Ăśdv,
> Levi
>


Igen.

http://java.sun.com/javase/6/docs/api/java/util/regex/Pattern.html

ĂĽdv
 Zs
--------- következő rész ---------
Egy csatolt HTML állomány át lett konvertálva...
URL: http://javagrund.hu/pipermail/javalist/attachments/20071127/000b85a1/attachment.html 


További információk a(z) Javalist levelezőlistáról