これを読む
GitHub - chriskite/anemone: Anemone web-spider framework
anemone.gemspec
s.require_path = "lib"
libを読むっぽい
↓
lib/anemone/anemone.rb
require 'rubygems' require 'anemone/core'
anemone/core ってのを読んでるっぽい
↓
エントリーポイント
def Anemone.crawl(urls, options = {}, &block)
Core.crawl(urls, options, &block)
end
ここであらためてAnemoneの使い方をおさらい
require 'bundler/setup'
require 'anemone'
url = 'http://kytiken.hatenablog.com/'
Anemone.crawl(url) do |anemone|
anemone.on_every_page do |page|
if page.doc
p page.url.to_s
p page.doc.at('title').inner_html
end
end
end
今日はここまで
次は
Anemone.crawl → anemone.on_every_page が動くようになるのかを見ていく