回答率: 85.35%

質問するログイン新規登録

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

新規登録して質問してみよう

ただいま回答率: 85.35%

トップスクレイピングに関する質問

Q&A

解決済

1回答

742閲覧

【python】while内のforが2回目以降認識されない

総合スコア6

0グッド

0クリップ

投稿2020/04/07 16:12

0

0

前提・実現したいこと

全てのページにある案件情報をスクレイピングして、
csvのファイルにまとめたい。

発生している問題・エラーメッセージ

while内のforが二回目以降、反映されません。
forのみwhileのループから外されているようです。

該当のソースコード

python
1from bs4 import BeautifulSoup
2import requests
3import pandas as pd
4import csv
5import time
6import urllib.parse
7import re
8
9num=0
10csvlist = [["","案件リスト","業界"]]
11load_url = "https://www.tranbi.com/buy/list/"
12
13while num>=0:
14    print(num)
15    html = requests.get(load_url)
16    soup = BeautifulSoup(html.content,"html.parser")
17
18    for project in soup.find_all(class_="buyList new flex"):
19        element = project.select_one("h2")
20        industry = project.find(class_="categorySuserIdBox")
21        csvlist.append([num, element.text, industry.text])
22        num +=1
23        time.sleep(1)
24        print(num)
25
26    next_pages=soup.select_one("[class='pagerNext']")
27
28    if next_pages is None:
29        break
30    else:
31        next_pages2 = next_pages.a['href']
32        link_url=urllib.parse.urljoin(load_url,next_pages2)
33        load_url=link_url
34        time.sleep(1)
35
36f = open("output.csv","w")
37writecsv = csv.writer(f, lineterminator='\n')
38
39writecsv.writerows(csvlist)

試したこと

「load_url=link_url」をコメントアウトすることで解決したが、
load_urlの更新は必須のため、原因を改名したい

補足情報（FW/ツールのバージョンなど）

ここにより詳細な情報を記載してください。

2020/04/08 00:30

> while内のforが二回目以降、反映されません。 > forのみwhileのループから外されているようです。どのようにその判断をしたのか、その理由も掲載してください。

行動規範の内容に同意します

回答1件

0

ベストアンサー

たんに２回めのload_urlのsoup.find_all(class_="buyList new flex")が空ってことではないかと。
そこらへんの値を見てみればどうでしょう

投稿2020/04/07 22:36

総合スコア88042

2020/04/24 08:25

ご丁寧にありがとうございました。ご指摘いただきました通り、空欄であったため、forが回りませんでした。本当にありがとうございます。

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問

トップスクレイピングに関する質問

【python】while内のforが2回目以降認識されない

関連した質問

同じタグがついた質問を見る

運営からのお知らせ

【ジャック広告の配信について】現在、非ログイン状態のユーザー様に対して一部の地域限定でジャック広告を配信しております。詳細につきましてはteratailブログをご確認ください。 https://blog.teratail.com/entry/jack-ad-202412

過去のお知らせを見る