<p>A js evaluation biztosan necces, foleg ha headless kell. Ugyanis a selenium kepes js-ezni is, de csak vmelyik browser backenddel.</p>
<p>Egyebkent ha unit teszteleshez kell, en felulvizsgalnam a kiindulo kovetelmenyeket. A selenium nagyon elterjedt, profi framework, az itt felsorolt elonyokkel rendelkezik, cserebe viszont megkeri az arat. Vmit vmiert.</p>
<p>Garami Gábor<br>
<a href="mailto:gabor.garami@hron.me">gabor.garami@hron.me</a><br>
Skype: hron84<br>
Tel: +36 20 235 9621</p>
<p>Sent from my T-Mobile G2<br>
Ezt a levelet telefonról adták fel, ékezethibákat tartalmazhat.</p>
<div class="gmail_quote">2012.06.29. 10:28, "Tamás Viktor" <<a href="mailto:viktor.tamas@gmail.com">viktor.tamas@gmail.com</a>> ezt írta:<br type="attribution"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Helló!<br>
Open source java web spiderekkel kapcsolatban van valakinek tapasztalata?<br>
Kiindulópontnak ezt találtam: <a href="http://java-source.net/open-source/crawlers" target="_blank">http://java-source.net/open-source/crawlers</a><br>
De mielőtt elkezdem végigpróbálgatni, kíváncsi lennék gyakorlati<br>
tapasztalatokra.<br>
<br>
Ezek a kritériumok:<br>
- Headless / nem akar GUI-t indítani. (követelmény)<br>
- Teljesen java, ne akarjon külső processzt indítani (követelmény)<br>
- Kényelmes az API-ja. XPath-ot, regexp-eket, iterátorokat jól lehet<br>
használni. (előny)<br>
- Némileg toleráns legyen a nem XML komform HTML-ekkel. (előny)<br>
- Kevés külső függősége legyen. (előny)<br>
- Legyen lehetőség a HTTP kapcsolat nyitásának felüldefiniálására. (előny)<br>
- Nemcsak letölteni tudja a HTML-t, hanem ki is tudja értékelni a<br>
javascripteket és azoknak megfelelően megváltoztatja a DOM-ot ha kell.<br>
(előny, még nagyobb előny, ha ez a feature kikapcsolható)<br>
- Fenn van Maven publikus repo-ban. (előny, de nem túl fontos)<br>
<br>
Üdv, V<br>
_______________________________________________<br>
Javalist mailing list<br>
<a href="mailto:Javalist@lists.javaforum.hu">Javalist@lists.javaforum.hu</a><br>
<a href="http://lists.javaforum.hu/mailman/listinfo/javalist" target="_blank">http://lists.javaforum.hu/mailman/listinfo/javalist</a><br>
</blockquote></div>