概要
rubyでrssを取得し、ファイルに出力するためのテンプレート。
titleとlinkタグを取得する。
スクレイピング用途で情報収集に便利。
なんかの記事であれば、取得したあとで形態素解析してkwを抽出するとか。
テンプレート
require 'rss'
###filename 取得したいRSSのurl
###filenames 任意のファイル名
filename = 'https://yuis-programming.com/feed' ##取得したいRSSのurl
rss = RSS::Parser.parse(filename)
rss.items.each{|item|
puts title = item.title
puts link = item.link
#puts des = item.description
filenames = "rss" ##任意のファイル名
File.open("C:" + filenames + ".txt", "a") do |f| #保存先のファイルをエディタなどで開いているとエラー
#f.puts item.title
f.puts title
f.puts link
#f.puts des
end
}
エラー対策
C:/Ruby23-x64/lib/ruby/2.3.0/net/http.rb:933:in `connect_nonblock’: SSL_connect returned=1 errno=0 state=error: certificate verify failed (OpenSSL::SSL::SSLError)
上記エラーを吐く場合は、urlを”https://” → ”http://”とするといける。
※セキュリティ上問題あり。信用できるサイトで。自己責任で。