質問編集履歴

URL追加

2019/04/19 08:29

投稿

motz-motz

スコア13

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -82,4 +82,4 @@
 Python 3.6.8
-[エラー発生時のHTML](htps://www.ncbi.nlm.nih.gov/pubmed)
+[エラー発生時のURL](https://www.ncbi.nlm.nih.gov/pubmed//?term=benzene)

スタックステート、エラー発生時のHTML、エラー発生時のソースコードの追加

2019/04/19 08:28

投稿

motz-motz

スコア13

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -16,7 +16,25 @@
 ```
+.
+.
+.
+ File "/anaconda3/lib/python3.6/site-packages/selenium/webdriver/remote/errorhandler.py", line 242, in check_response
+    raise exception_class(message, screen, stacktrace)
 ElementNotVisibleException: element not visible
+  (Session info: chrome=73.0.3683.103)
+  (Driver info: chromedriver=2.38.552518 (183d19265345f54ce39cbb94cf81ba5f15905011),platform=Mac OS X 10.14.4 x86_64)
 ```
@@ -26,147 +44,25 @@
 ```Python
-#abstract(text)でクローリング
+if exception_class == ErrorInResponseException:
-import time
+            raise exception_class(response, message)
-from selenium import webdriver
+        elif exception_class == UnexpectedAlertPresentException:
-import pandas as pd
+            alert_text = None
-#from selenium.webdriver.support import expected_conditions as ec
+            if 'data' in value:
+                alert_text = value['data'].get('text')
+            elif 'alert' in value:
-def main():
+                alert_text = value['alert'].get('text')
-    #検索キーワード入力
+            raise exception_class(message, screen, stacktrace, alert_text)
-    keyword = "benzene"
-    data = get_pubmed_info(keyword)
-    get_dataframe(data, keyword)
-def get_pubmed_info(keyword):
-    #webブラウザ指定（Chrome）
-    driver = webdriver.Chrome()
-    url = "https://www.ncbi.nlm.nih.gov/pubmed/?term="+keyword.replace(' ','+')
-    #ページ遷移
-    driver.get(url)
-    #暗黙の待機
-    driver.implicitly_wait(2)
-   #専用データ作成
-    data = []
-    #ページ数取得
-    try:
-        page_num = int(driver.find_element_by_id('pageno').get_attribute('last'))
-    #ページ数「１」の時例外扱いになる時があるため、その対策
-    except:
-        page_num = 1
-    #全ページ内のクローリング
-    for i in range(int(page_num)):
-        #abstract(text)方式の論文ページ表示
-        driver.find_element_by_name('Display').click()
+        raise exception_class(message, screen, stacktrace)
-        [tag for tag in driver.find_elements_by_tag_name('input')
-        if (tag.get_attribute('value') == 'abstract')][1].click()
-        #表示順に上から論文タイトル、要旨、keywords取得
-        source = driver.page_source.split('\n\n\n')
-        for paper in source:
-            block = paper.split('\n\n')
-        if(len(block) >= 6):
-            data.append(block)
-            driver.back()
-            time.sleep(1)
-        if (i < page_num - 1):
-            try:
-                driver.find_element_by_css_selector('a.active.page_link.next').click()
-                print(i)
-                time.sleep(3)
-            except:
-                driver.current_url
-                time.sleep(5)
-                driver.find_element_by_css_selector('a.active.page_link.next').click()
-                print(i)
-                time.sleep(3)
-        else:
-            driver.back()
-            time.sleep(3)
-            """if element not visible
-            if element not visible:
-                driver.current_url
-                driver.close()"""
-    return data
-if __name__ == "__main__":
-    main()
 ```
@@ -185,3 +81,5 @@
 Python 3.6.8
+[エラー発生時のHTML](htps://www.ncbi.nlm.nih.gov/pubmed)