[Java lista] Reguláris kifejezés
Zsombor
gzsombor at gmail.com
2007. Nov. 27., K, 14:07:36 CET
On 11/27/07, Levi <levpista at freemail.hu> wrote:
>
> Sziasztok!
>
> Nézzétek már meg légyszi ezt a kifejezést, mert valami nem oké vele.
> Egy HTML oldalról szeretnék adatokat kinyerni.
> Jelen esetben a TITLE tag értékét szeretném megkapni (<title>...</title>).
> ElĹ‘ször PHP-ben Ărtam meg, ami teljesen jĂłl működik:
> // $html itt, a html oldal maga
> $pattern =
> "/<title(?:\s(?:'[^']*'|"[^"]*"|[^'">])*){0,1}>((?:[^<]|<(?!\/title>))*)<\/title>/iX";
> $title = preg_match($pattern, $html, $title) ? $title[1] : '';
>
> Gondoltam java-ra sem lesz nehezebb implementálni:
> /* Az inputStr itt, a html oldal maga */
> boolean result;
> String patternStr =
> "/<title(?:\s(?:'[^']*'|"[^"]*"|[^'">])*){0,1}>((?:[^<]|<(?!\/title>))*)<\/title>/iX";
> Pattern pattern = Pattern.compile(patternStr);
> Matcher matcher = pattern.matcher(inputStr);
> result = matcher.find();
>
> Érdekes mĂłdon a java nem talált egyezĂ©st, mĂg a php simán kidobta az
> eredményt.
>
> Van valami ötletetek?
>
> Ăśdv,
> Levi
>
Igen.
http://java.sun.com/javase/6/docs/api/java/util/regex/Pattern.html
ĂĽdv
Zs
--------- következő rész ---------
Egy csatolt HTML állomány át lett konvertálva...
URL: http://javagrund.hu/pipermail/javalist/attachments/20071127/000b85a1/attachment.html
További információk a(z) Javalist levelezőlistáról