回答率: 85.25%

質問するログイン新規登録

トップスクレイピングに関する質問python seleniumでクローラーを作成したいがdictの中身が空になる

Q&A

0回答

1747閲覧

python seleniumでクローラーを作成したいがdictの中身が空になる

総合スコア12

0グッド

0クリップ

投稿2019/05/21 04:05

編集2019/05/22 06:44

0

0

前提・実現したいこと

ある動的なhttpsサイトからリストを全てスクレイピングしようとしています

発生している問題・エラーメッセージ

途中まででprint()で値が表示されるのにdictが空になる
クローラーを作りたいのに1件しかデータを取りにいっていない気がする

該当のソースコード

Python
1url='https://advisors-freee.jp/advisors/search'
2from selenium import webdriver
3browser = webdriver.Chrome()
4browser.implicitly_wait(10)
5browser.get(url)
6
7assert'全国の税理士一覧｜税理士検索freee'in browser.title
8
9links = browser.find_elements_by_css_selector('h3.search-ttl')
10company_name = links[0].text
11
12links[0].click()
13
14new_window = browser.window_handles[1]
15browser.switch_to_window(new_window)
16
17member = browser.find_elements_by_css_selector('div.right-box')
18#assert '認定アドバイザー' in member.find_element_by_css_selector('h2').text
19
20member_dict = {}
21member_dict[company_name] = member
22
23import requests
24from bs4 import BeautifulSoup
25
26member_list = []
27for member_dict in member:
28    member_list.append(member)
29
30import pandas as pd
31F_dt = pd.DataFrame.from_dict(member)
32F_dt.apply( lambda x: x.str.replace(r'(new|写真|動画)',''))
33
34print(F_dt)
35

試したこと

参考にしたURLはこちらです。
https://takahiromiura.github.io/Selenium.html

補足情報（FW/ツールのバージョンなど）

VS CODEでPython3.7を使用しています

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.25%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問

トップスクレイピングに関する質問

python seleniumでクローラーを作成したいがdictの中身が空になる

関連した質問

同じタグがついた質問を見る

運営からのお知らせ

【不具合修正のお知らせ】いつもteratailをご利用いただき、誠にありがとうございます。過去の質問のうち、タグのついていない質問の一部において、ページが正しく表示されない不具合がございましたが、表示されるように修正させていただきましたので、お知らせいたします。この度はご不便をおかけしましたことお詫び申し上げます。引き続き安心してteratailをご利用いただけますよう、運営一同努めてまいります。今後ともよろしくお願いいたします。

過去のお知らせを見る