去年の社会人一年生の人からRubyを独習するネタがなんかないかって質問があったのでスクレイピングを推してみました。そういうわけで自分でも実践。
諸般の事情でNokogiriでなくHpricotを練習。
インストールはよくわかんないんだけど、hpricot.com経由でgithubへ行ってソースをダウンロード。展開してこんな手順で。(メモ取ってなかったから違ってるかも)
% ruby setup.rb config % ruby setup.rb setup % sudo ruby setup.rb install
あるサイトの検索ページを利用して結果を加工する例。 の処理が面倒くさかった。/\s/にはマッチしないのね。
1.8系でしか試してません。-Kuつけてutfで実行。 たとえばこんな。
% ruby -Ku hoge.rb ピカチュウ
ああーーっ。せっかくの機会なのに、レシピ本を参考にするのを忘れてた。ごめん。この本にHpricotが紹介されているかどうか、みんなで探そう!
追記
コメントでもご指摘がありましたが、Hpricotは出てなかったです。残念。
なお、増刷された大人気の『Ruby逆引きハンドブック』にはHpricotが出ています。本当に出ているか、みんなもう一冊買って確認しよう!
いいなー増刷。