機能 ショートカットキー
リファレンス(参考URL)一覧へ移動 R
記事URLをMarkDownとしてコピー Ctrl+M
前のコードタグへ移動 Ctrl+←
次のコードタグへ移動 Ctrl+→
ヘルプを表示・非表示 H
Tips
- ショートカットキーは記事上で有効です。ヘッダー/フッター付近では機能しないことがあります。
- コードタグ移動機能がうまく動かないときは、Shift+F5でページを更新してみてください。
- このウィンドウを閉じるには、Hキーをもう一度押してください

[ruby]xml形式のrssを取得してファイルに出力する。

プログラミング

概要

プログラミング

rubyでrssを取得し、ファイルに出力するためのテンプレート。
titleとlinkタグを取得する。

スクレイピング用途で情報収集に便利。
なんかの記事であれば、取得したあとで形態素解析してkwを抽出するとか。

テンプレート

プログラミング
require 'rss'

###filename 取得したいRSSのurl
###filenames 任意のファイル名

filename = 'https://yuis-programming.com/feed'        ##取得したいRSSのurl
rss = RSS::Parser.parse(filename)
rss.items.each{|item|
  puts title = item.title
  puts link = item.link
  #puts des = item.description

    filenames = "rss"        ##任意のファイル名
    File.open("C:" + filenames + ".txt", "a") do |f|  #保存先のファイルをエディタなどで開いているとエラー
    #f.puts item.title
    f.puts title
    f.puts link
    #f.puts des
    end

}

エラー対策

C:/Ruby23-x64/lib/ruby/2.3.0/net/http.rb:933:in `connect_nonblock’: SSL_connect returned=1 errno=0 state=error: certificate verify failed (OpenSSL::SSL::SSLError)

上記エラーを吐く場合は、urlを”https://” → ”http://”とするといける。

※セキュリティ上問題あり。信用できるサイトで。自己責任で。

この記事で欲しい情報が見つからなかった方へ

この記事の更新情報がある場合があります。
この記事は以下の記事とも関連性があると思われます。

Ruby windowsのソフトウェアを外部コマンドから開く・起動する
Ruby sinatra 使い方
Ruby hash キーが重複していた場合は2つの値を加算する
Ruby jrubyをインストールしてからGEMのパスが変わってしまった場合の対処
Rubyでhashや配列をeach_with_indexで最初と最後の処理だけ特別な処理をする
Rubyで配列の集合演算
Rubyでmechanizeでブログをキーワード検索して最初の投稿を取得する


管理人の方針で、既存の記事の編集はせず、新しい情報や大きな既存情報の更新があった場合には、新しい記事として公開することになっています。
当記事で欲しい情報が見つからなかった・解決に至らなかった場合、これらのリンクがお役に立てるかも知れません。

どうやってこの関連記事を生成しているの?
この機能のPHPソースコード(2500行)

コメントを残す

Close Menu