pythonでログインしてスクレイピングしたいがレスポンス500エラーになってしまう

以下の記事を参考にpythonでQiitaへログインしてログイン後のページタイトルをスクレイピングしようとしてみましたが、ログイン前のタイトルが取得されてしまいます。

https://qiita.com/morinokami/items/46b76b365f030be83418

seleniumは使わないでログインしたいです。
python-3.6

python
1from bs4 import BeautifulSoup
2import requests
3
4user="~"
5pas="~"
6
7payload = {
8    'utf8': '✓',
9    'identity': user,
10    'password': pas
11}
12
13# authenticity_tokenの取得
14s = requests.Session()
15r = s.get('https://qiita.com')
16soup = BeautifulSoup(r.text, 'html.parser')
17auth_token = soup.find(attrs={'name': 'authenticity_token'}).get('value')
18payload['authenticity_token'] = auth_token
19
20#アクセストークンは正常に取得できている
21print(auth_token)
22
23# ログイン
24res=s.post('https://qiita.com/login' ,data=payload)
25
26#レスポンス500が返ってくる
27print(res)
28
29ss=s.get("https://qiita.com/settings/notifications")
30soup = BeautifulSoup(ss.text, 'html.parser')
31title=soup.find("title")
32
33#ログイン後のタイトルなら「Qiitq」ログイン前は「Login - Qiita」が出力される
34print(title)

s.post('https://qiita.com/login' ,data=payload)

がレスポンス500になってしまいます。

行動規範の内容に同意します

回答1件

ベストアンサー

auth_tokenはloginページで取得したほうがいいんじゃないですかね?
あとこれくらいならBeautifulSoup使うまでもなく正規表現で済みますね。

python
1r = s.get("https://qiita.com/login")
2auth_token = re.search(r'authenticity_token.*?value="(.*?)"', r.text).group(1)
3payload['authenticity_token'] = auth_token
4res = s.post("https://qiita.com/login", data=payload)