回答率: 85.30%

質問するログイン新規登録

トップスクレイピングに関する質問ログイン状態を保ったままリンク先に移動したい

編集履歴

回答編集履歴

2

訂正

2020/12/08 04:59

投稿

スコア1438

answer CHANGED Viewed

@@ -22,6 +22,6 @@
 あとはsk-sora--ypiさんが回答している様に
-ログイン情報を引き継いだ状態でスクレイピングを行いたいならば
+ログイン情報を保持した状態でスクレイピングを行いたいならば
 for文内でのリクエストを行う際にもsesとしてスクレイピングを行うと良いでしょう。
 sesを使用せず普通にrequests.getとしてしまうとログイン情報が切れてしまいます。

1

追記

2020/12/08 04:59

投稿

スコア1438

answer CHANGED Viewed

@@ -1,12 +1,12 @@
-恐らくはどこかのページを参考としたのでしょうがログイン時のURLとパラメータが間違えている様です。
+ログイン時のURLとパラメータが間違えている様です。
-また慣例としてはページのレスポンスに対しresと変数を付ける事がよく見られますが
+また慣例としてはページのレスポンスに対しresやrと変数を付ける事がよく見られますが
 セッションに対しては[ログイン情報を保った状態でアクセスしている]と言う事がわかりやすい様に
 変数名はresではなくsesと定義してあげる事をおすすめします。
 以下のコードでログインした状態でのページの取得ができているかと思います。
 print(soup)としてログイン後の情報が表示されているかお確かめください。
-出力した際にマイページやログアウトといった項目が表示されていれば正常にログインができている証拠です。
+マイページやログアウトといった項目が表示されていれば正常にログインができている証拠です。
 ```python
 login_url = 'https://ja.nc-net.or.jp/login/'
 login_data = {
@@ -18,4 +18,10 @@
 page_url = 'https://ja.nc-net.or.jp/search/equipment/?cl[]=1'
 soup = BeautifulSoup(ses.get(page_url).content, 'lxml')
 print(soup)
-```
+```
+あとはsk-sora--ypiさんが回答している様に
+ログイン情報を引き継いだ状態でスクレイピングを行いたいならば
+for文内でのリクエストを行う際にもsesとしてスクレイピングを行うと良いでしょう。
+sesを使用せず普通にrequests.getとしてしまうとログイン情報が切れてしまいます。