機能 ショートカットキー
リファレンス(参考URL)一覧へ移動 R
記事URLをMarkDownとしてコピー Ctrl+M
前のコードタグへ移動 Ctrl+←
次のコードタグへ移動 Ctrl+→
ヘルプを表示・非表示 H
Tips
- ショートカットキーは記事上で有効です。ヘッダー/フッター付近では機能しないことがあります。
- コードタグ移動機能がうまく動かないときは、Shift+F5でページを更新してみてください。
- このウィンドウを閉じるには、Hキーをもう一度押してください

Scraping web page title with wget on termianl

プログラミング

During development, it is useful to scrape title tags and h1 tags when checking a little content of the link destination or checking for errors.

scraping from “yahoo.com” on terminal console using “wget”.

$  wget --quiet -O - yahoo.com | sed -n -e 's!.*<title>\(.*\)</title>.*!\1!p'
Yahoo

Define function

プログラミング
gettitle(){ wget --quiet -O - $1 | sed -n -e 's!.*<title>\(.*\)</title>.*!\1!p' ;}
  • usage
$ gettitle https://stackoverflow.com/questions/9312154/wget-page-title
shell - Wget page title - Stack Overflow

$ gettitle localhost
Apache2 Ubuntu Default Page: It works
  • add .bashrc
cat << EOT >> ~/.bashrc
# gettitle()
gettitle(){ wget --quiet -O - $1 | sed -n -e 's!.*<title>\(.*\)</title>.*!\1!p' ;}
EOT

References:
https://stackoverflow.com/questions/9312154/wget-page-title

この記事で欲しい情報が見つからなかった方へ

この記事の更新情報がある場合があります。
この記事は以下の記事とも関連性があると思われます。

Windows10 WSLでwgetでダウンロードしたファイルが削除できない


管理人の方針で、既存の記事の編集はせず、新しい情報や大きな既存情報の更新があった場合には、新しい記事として公開することになっています。
当記事で欲しい情報が見つからなかった・解決に至らなかった場合、これらのリンクがお役に立てるかも知れません。

どうやってこの関連記事を生成しているの?
この機能のPHPソースコード(2500行)

コメントを残す

Close Menu