質問編集履歴

エラー箇所の追記

2019/01/28 11:47

投稿

machi1092

スコア12

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -13,6 +13,7 @@
 ### 該当のソースコード
 ```ここに言語名を入力
+#モジュールのインポート
 from selenium import webdriver
 import os
 from bs4 import BeautifulSoup
@@ -22,35 +23,39 @@
 from selenium.webdriver.support import expected_conditions as EC
 from selenium.webdriver.common.by import By
+#取得したい要素(職業名や仕事内容)の変数定義
 job_cards = 'a.catch'
 job_names = 'h2.job'
 job_descriptions = 'div.jobCatch'
 job_requirements_musts = 'div.mustSet'
 next_bottun = 'a.btn.next'
+#webdriverの設定・URLへ遷移・要素が読み込まれるまでの待機時間の設定
 driver = webdriver.Chrome(executable_path="C:...")
 url = 'https://en-ambi.com/'
 wait = WebDriverWait(driver, 10)
 driver.get(url)
 def main():
-    while True:
+    while True: #次へボタンがあるまで繰り返し
         if len(driver.find_element_by_css_selector(next_bottun).text) > 0:
+　　　　　　 #ページ内の求人詳細に遷移する要素の全取得
             cards = driver.find_elements_by_css_selector(job_cards)
-            for card in cards:
+            for card in cards: #↑で取得した要素をクリックし遷移したページで下記処理を行う
                 try:
                     card.click()
+　　　　　　　　　　　#恐らくここまでは正常に動いていて下記から上手く処理できずエラーが起こっている
                     wait.until(EC.presence_of_element_located((By.ID, "descBase")))
-                    job_name = driver.find_element_by_css_selector(job_names).text
+                    job_name = driver.find_element_by_css_selector(job_names).text #職業名をテキストで取得する
                     job_description = driver.find_element_by_css_selector(job_descriptions).text
                     job_requirements_must = driver.find_element_by_css_selector(job_requirements_musts).text
-                    se = pd.Series([job_name,job_description,job_requirements_must],['job_name','job_description','job_requirements_must',])
+                    se = pd.Series([job_name,job_description,job_requirements_must],['job_name','job_description','job_requirements_must',])
                     df = pd.DataFrame()
                     df = df.append(se,ignore_index=True)
                     driver.back()
                 except Exception as e:# -*- coding: utf-8 -*-
                     print(e)
-            next = driver.find_element_by_css_selector(next_bottun).get_attribute("href")
+            next = driver.find_element_by_css_selector(next_bottun).get_attribute("href") #ページ内の次へボタンの要素を取得
             driver.get(next)
         else:
             print('No page')

タイトルの編集

2019/01/28 11:47

投稿

machi1092

スコア12

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- seleniumで情報を取得したい
1	+ selenium(Python)で情報を取得したいが、要素が読み込まれるのを待機できていない？等の理由で取得できない

body CHANGED Viewed

File without changes

文字の修正

2019/01/27 10:41

投稿

machi1092

スコア12

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -28,8 +28,8 @@
 job_requirements_musts = 'div.mustSet'
 next_bottun = 'a.btn.next'
-driver = webdriver.Chrome(executable_path="C:/Users/Daichi Yamamasu/Anaconda3/Lib/site-packages/selenium/webdriver/chromedriver.exe")
+driver = webdriver.Chrome(executable_path="C:...")
-url = 'https://en-ambi.com/search/?jobtype=1614010&area=23'
+url = 'https://en-ambi.com/'
 wait = WebDriverWait(driver, 10)
 driver.get(url)