Ruby

RubyでRSSを取得する方法

概要

rubyでrssを取得し、ファイルに出力するためのテンプレート。
titleとlinkタグを取得する。

スクレイピング用途で情報収集に便利。
なんかの記事であれば、取得したあとで形態素解析してkwを抽出するとか。

テンプレート

require 'rss'

###filename 取得したいRSSのurl
###filenames 任意のファイル名

filename = 'https://yuis-programming.com/feed'        ##取得したいRSSのurl
rss = RSS::Parser.parse(filename)
rss.items.each{|item|
  puts title = item.title
  puts link = item.link
  #puts des = item.description

    filenames = "rss"        ##任意のファイル名
    File.open("C:" + filenames + ".txt", "a") do |f|  #保存先のファイルをエディタなどで開いているとエラー
    #f.puts item.title
    f.puts title
    f.puts link
    #f.puts des
    end

}

エラー対策

C:/Ruby23-x64/lib/ruby/2.3.0/net/http.rb:933:in `connect_nonblock’: SSL_connect returned=1 errno=0 state=error: certificate verify failed (OpenSSL::SSL::SSLError)

上記エラーを吐く場合は、urlを”https://” → ”http://”とするといける。

※セキュリティ上問題あり。信用できるサイトで。自己責任で。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です