Slackのチャンネルに流れるリンクを取得するコード

###前提・実現したいこと
ここに質問したいことを詳細に書いてください

現在、情報共有のためにチームのSlackのチャンネル上で流れるリンクが一週間で膨大な数になるため
チャンネルに投稿されたURLを一括で取得できるコードを探しています。
できればメインはPythonを使っているのでPythonでコードをいただけると嬉しいです。
もし既に書かれている方がいらっしゃいましたら、教えていただけますでしょうか？

イメージcsv or text

<table border=1>
 <tr><th></th><th>日付</th><th>URL</th></tr>
 <tr><td>2016-06-13</td><td>google.com</td><td>B-1</td></tr>
 <tr><td>2016-06-13</td><td>google.com</td><td>B-2</td></tr>
 <tr><td>2016-06-13</td><td>google.com</td><td>B-3</td></tr>
</table>

行動規範の内容に同意します

回答2件

SlackだとWebAPIもあるので、そちらからまとめてピックアップするのが一番早そうな気がします。

https://api.slack.com/methods/channels.history

このAPIでチャンネルのメッセージ履歴を取れるので、そこからURL部分を抽出するなどはできるかと。
抽出urllib2やrequestsなどライブラリでHTTP叩くでもいいですし、
APIクライアントのライブラリもあるみたいなので、その辺りはお好みで。

投稿2016/06/14 03:40

編集2016/06/14 03:57

attakei

総合スコア2738

HTMLは取得して手元にある、という前提で良いんでしょうか？

HTMLを解析するには、BeautifulSoupというライブラリーが良く使われています。

URLを羅列するだけなら、こんな感じになります。

lang
1from bs4 import BeautifulSoup
2
3html = '''
4<table border=1>
5 <tr><th></th><th>日付</th><th>URL</th></tr>
6 <tr><td>2016-06-13</td><td>google.com/1</td><td>B-1</td></tr>
7 <tr><td>2016-06-13</td><td>google.com/2</td><td>B-2</td></tr>
8 <tr><td>2016-06-13</td><td>google.com/3</td><td>B-3</td></tr>
9</table>
10'''
11
12soup = BeautifulSoup(html, 'lxml')
13
14for tr in soup.find_all('tr'):  # すべてのtrを取得
15    if tr.td:
16        tds = tr.select('td')  # trの下のtdのリストが得られる
17        print("url =", tds[1].text)
18    else:
19        print('tr has no td')

実行結果

tr has no td
url = google.com/1
url = google.com/2
url = google.com/3

投稿2016/06/13 15:21

argius

総合スコア9388

gvbatei

2016/06/14 01:36

申し訳ございません。 HTMLソースは無いです。 Slack上に流れているhttp:/の情報を取得し日付とURLでｃｓｖか何かで吐き出したいです。

argius

2016/06/14 01:49

urllib2などのモジュールと組み合わせればオンラインHTMLでもできます BeautifulSoupで調べてみればヒントが見つかるでしょう。 CSVも検索すれば見つかるはずです。

gvbatei

2016/06/14 02:25

ありがとうございます！

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

Slackのチャンネルに流れるリンクを取得するコード

関連した質問