logo
Published on

Nokogiriでメタタグ・メタキーワードを取得する

Authors

Rubyプログラミング言語のスクレイピングライブラリNokogiriを使用してSEO対策に使われるHTMLメタタグのメタキーワードなどを取得する方法について紹介します。

doc = Nokogiri::HTML(page.body)

doc.at("meta[name='keywords']")['content']
# or
doc.xpath('//meta[@name="keywords"]/@content').text

上記のプログラムは以下のような手順で実行されます。

  • Nokogiri::HTMLメソッドでHTMLを解析する
  • atメソッドでmetaタグのname属性がkeywordsの要素を取得する
  • content属性の値を取得する

また、metaタグのname属性がdescriptionの要素を取得する場合は以下のようになります。

doc.at("meta[name='description']")['content']