hitode909の日記

趣味はマリンスポーツですの日記です

指定されたURLを開いていってHTMLとしてパースしてCSSセレクタがマッチしたらURLを出力するやつ

URLがたくさんあって,この中で,ソーシャルボタンを含むのはどのURLなのか? というときに目視で見ては疲れるので,ちょっとしたスクリプトを書いてみた.
たとえば,ブログのいろんなページのうち,twitterのwidgets.jsをロードしているのはどこなのか? というとき

% cat urls.txt
http://blog.sushi.money/
http://blog.sushi.money/about
http://blog.sushi.money/entry/futa
% cat urls.txt | bundle exec -- ./grep-by-css-selector 'script[src="//platform.twitter.com/widgets.js"]'
http://blog.sushi.money/
http://blog.sushi.money/entry/futa

こんなかんじで,トップページと,記事ページ,ということが分かる.
単なるテキストのgrepと比べると,指定されたURLを開いてくれるところと,CSSセレクタを使えるところが違う.

github.com