>
新型コロナに感染しない・させないための行動を。詳細はこちら。

BOTを作った話本編

こっちもナンバリングしたからシリーズ感でた。(確信)

いや嘘じゃんナンバリングしたけど一本で終わっちゃったからナンバリング消したじゃん・・。

WordPress物語も始まっちゃったからこっちはさっさと終わらせたいと思います。

 

1. 過去記事の一覧を取得する

まずやるべきは現状存在する過去記事の一覧を取得することです。

これにはスクレイピングと呼ばれる作業が必要になります。スクレイピングとはWebページのデータ構造を解析・取得する操作のことで、今回はRubyというスクリプト言語とその上で動作するnokogiriというライブラリによって行いました。

 

Rubyをインストールしたらそこからはコマンドでnokogiriをインストールします。

昔ちょっとiPhoneの脱獄に手出してたけどapt-getみたいな感じで名前指定でインストールできるんだね。

f:id:nunu1733:20200118164514p:plain

 

あとはもうコピペでできました。

前回紹介した2本目の記事にさらに紹介されていたこのサイトよりスクリプトをお借りしてURL指定部分などをちょこちょこっといじって実行です。

qiita.com

なんでか出力してくれたCSVファイルをエクセルに読み込んでも区切り記号のカンマを認識してくれないと思ったら項目ごとにダブルクォーテーションでくくられてたのでテキストエディタで除去してからスプレッドシートに移植

f:id:nunu1733:20200118165655p:plain

f:id:nunu1733:20200118165744p:plain

一覧はこれでできました。どのみちランダム選択で使われるので関係ないですが気分的に順番ははじめが上に来るようにしました。

 

2. 自動でリストに追記するやつを作る。

あとは記事を更新するたびに毎回この作業をやらなくて済むように投稿された記事の情報を自動で追記してくれる仕組みを作ります。とは言ってもここからあとはこのサイトに従うだけでできたので同じことを全部書き直すのもちょっと違うなぁってことで。

moripro.net

やり方っていうか手順っていうかはもりさんの記事を見ていただければと。

ここからは個人的にちょっと詰まったりした部分についてお話ししようと思います。

 

この手順に従うとまずやるのはTwitterの開発者アカウントの取得なんですけど。

英語です。サイトがじゃなくて、英語でいろいろ説明するんです。ただ会社とかで外国の方とかと少しでもやり取りの経験があるとわかると思うんですけど、結構英語くらいなら単語の羅列で頑張ればあっちも頑張って読み取ってくれます。どうもTwitterの中の人もそういう傾向がある程度あるのか(まあ人が読んでるのかどうかもわかりませんが)どうにかその程度の英語で通してもらえました。

 

 

なぜか申請完了メールだけ日本語でした。(登録完了メールは再び英語)

 

 

いやちょっとでも困ったのここだけでした。丁寧な説明っていうのもありますが、多分実はそんなに難しいことをやっているわけではないので。

コメント

タイトルとURLをコピーしました