Anemone gemをコードリーディングする(1)

これを読む

GitHub - chriskite/anemone: Anemone web-spider framework

anemone.gemspec

  s.require_path = "lib"

libを読むっぽい

lib/anemone/anemone.rb

require 'rubygems'
require 'anemone/core'

anemone/core ってのを読んでるっぽい

エントリーポイント

def Anemone.crawl(urls, options = {}, &block)
  Core.crawl(urls, options, &block)
end

ここであらためてAnemoneの使い方をおさらい

require 'bundler/setup'
require 'anemone'

url = 'http://kytiken.hatenablog.com/'
Anemone.crawl(url) do |anemone|
  anemone.on_every_page do |page|
    if page.doc
      p page.url.to_s
      p page.doc.at('title').inner_html
    end
  end
end

今日はここまで

次は

Anemone.crawlanemone.on_every_page が動くようになるのかを見ていく