[Java lista] HTML parse
Aron Gombas
aron.gombas at midori.hu
2007. Okt. 25., Cs, 08:09:01 CEST
Szia!
Ha a HTML well-formatted, akkor a recept altalaban az hogy
XML-es eszkozokkel mesz neki. Esetben egy egyszeru SAX parser
vagy XQuery celravezeto lehet.
Ha a HTML esetleg nem garantaltan XHTML, akkor eloszor meg
futtasd at JTidy-n.
Nekem ez tobb projektben sikeresen mukodott.
--
Aron Gombas
Founder, http://www.midori.hu
Founder, http://labs.jboss.com/kosmos
Gábriel Ákos wrote:
> Sziasztok,
>
> Van egy jó kis feladatom: csomó IMAP-os levélből ki kell venni HTML
> attachmentet, és ebben levő táblázatot kell parsolni.
> Sok egyforma van, tehát a mintaillesztés viszonylag egyszerű.
> Odáig már megvagyok, hogy imapről megvan a levél, belőle a megfelelő
> attachment part stringben.
> Viszont a html parsolással (valahol benne van a táblázat) vagyok
> bajban. Odáig megvan, hogy tagsoup, de:
>
> 1. hogyan kell használni
> 2. hogyan kéne erre valami értelmes parsert írni?
>
> A táblázat mondjuk második sorától már így néz ki:
>
> <tr><td width=60% style="border:solid navy .5pt;border-top:none;
> background:#E5E8F1;"> <font
> style="font-size:8.5pt;font-family:Arial;color:navy">Tőkevédelmi
> eszközalap</font></td> <td width=20% valign=top align=right
> style="border-top:none;border-left:none; border-bottom:solid navy .5pt;
> border-right:solid navy .5pt;background:#E5E8F1;"> <font
> style="font-size:8.5pt;font-family:Arial;color:navy">1,14246</font></td>
> <td width=20% valign=top align=right
> style="border-top:none;border-left:none; border-bottom:solid navy .5pt;
> border-right:solid navy .5pt;background:#E5E8F1;"> <font
> style="font-size:8.5pt;font-family:Arial;
> color:navy">1,17779</font></td></tr> <tr><td width=60%
> style="border:solid navy .5pt;border-top:none; background:#E5E8F1;">
> <font style="font-size:8.5pt;font-family:Arial;color:navy">Európai
> vállalati kötvény eszközalap</font></td> <td width=20% valign=top
> align=right style="border-top:none;border-left:none;
> border-bottom:solid navy .5pt; border-right:solid
> navy .5pt;background:#E5E8F1;"> <font
> style="font-size:8.5pt;font-family:Arial;color:navy">0,98780</font></td>
> <td width=20% valign=top align=right
> style="border-top:none;border-left:none; border-bottom:solid navy .5pt;
> border-right:solid navy .5pt;background:#E5E8F1;"> <font
> style="font-size:8.5pt;font-family:Arial;
> color:navy">1,01835</font></td></tr>
>
> Ebből kéne nekem a név meg a két szám :)
>
> Köszi előre is,
> Ákos
>
További információk a(z) Javalist levelezőlistáról