プログラマの道具箱
Pages - Menu
(移動先: ...)
ホーム
▼
2008年9月28日日曜日
Jericho HTML Parser - Javaでスクレイピング
Jericho HTML Parser
WebAPIが用意されていない(もしくはフィードが提供されていない)サイトから、必要な情報だけをとりたいなぁというときにスクレイピングするわけですが、このJerichoはすごく使えそうです。というのも、このJerichoはいい加減なHTMLもそれなりに解析してれるようなです。といってもまだそこまで使い倒してないのでなんともいえないですが。
ASP、JSP、PSP、PHP、Mason などのサーバページ技術のファイルも読めるようです。
0 件のコメント:
コメントを投稿
‹
›
ホーム
ウェブ バージョンを表示
0 件のコメント:
コメントを投稿