HTMLパーサー Jsoup

JavaでのHTMLパーサーは色々と種類があります。今回、AndroidアプリでHTMLをパースする必要があり

一番お手頃で使い勝手の良い、Jsoupを使ってみました。簡単な使用方法をまとめておきます。

環境はAndroidStuid利用での前提とします。

 

セットアップ

build.gradleファイルProject用とModuke用があります。Module用を修正します。

dependenciesにJsoupの依存関係を追加します。同期をとります。

 

使ってみる

サンプルとしてあるHTMLページの画像(IMGタグ)の画像ファイル(src)属性の内容をすべて出力する処理は以下のようになります。

使い勝手がよく効率よくパースする処理が書けそうです。他にも便利なメソッドがありそうですので詳細はJsoupのサイト http://jsoup.org/ へ