質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

ダウンロード

リモートシステムからローカルシステムへとデータを受信する事、もしくはそのようなデータ転送を行う事をダウンロードと呼びます。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

Q&A

解決済

1回答

2253閲覧

chromedriverを用いたCSVファイルの自動ダウンロードにおいて、最後まで動作はしているようですがファイルのダウンロードが行われません

tohon

総合スコア10

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

ダウンロード

リモートシステムからローカルシステムへとデータを受信する事、もしくはそのようなデータ転送を行う事をダウンロードと呼びます。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

0グッド

1クリップ

投稿2020/03/27 09:21

編集2020/03/27 09:24

chromedriverを使って、気象庁のHPから気象データを自動ダウンロードしようとしています。
コードを実行すると、一番最後に記述したテキストの出力がされているのですべて動作はしているようなのですが、肝心のCSVファイルのダウンロードがなされていません。
コードをご覧いただき、どのような問題があるのかご教示いただけないでしょうか。
動作確認はコマンドプロンプト上、jupyter notebook上で行いました。

python

1from selenium import webdriver 2from selenium.webdriver.chrome.options import Options 3import time 4 5options = Options() 6options.add_argument('--headless') 7driver = webdriver.Chrome('C:/Program Files/chromedriver_win32/chromedriver.exe', options=options) 8html = driver.get("http://www.data.jma.go.jp/gmd/risk/obsdl/index.php")#気象庁ダウンロードサイトへ行く 9time.sleep(1) 10 11#ダウンロードする項目を選ぶ 12driver.find_element_by_id('elementButton').click() 13time.sleep(1) 14#気温のみ選択 15driver.find_element_by_xpath('//*[@id="aggrgPeriod"]/div/div[1]/div[1]/label/input').click() 16time.sleep(1) 17driver.find_element_by_xpath('//*[@id="気温"]').click() 18time.sleep(1) 19#期間を選ぶ 20driver.find_element_by_id('periodButton').click() 21time.sleep(1) 22driver.find_element_by_xpath('//*[@id="selectPeriod"]/div/div[2]/div[1]/label/span').click() 23time.sleep(1) 24driver.find_element_by_xpath( '//*[@id="selectPeriod"]/div/div[2]/div[2]/div[2]/select[1]/option[3]').click() # 2017年 25time.sleep(1) 26driver.find_element_by_xpath('//*[@id="selectPeriod"]/div/div[2]/div[2]/div[1]/select[1]/option[12]').click() #12月 27time.sleep(1) 28driver.find_element_by_xpath('//*[@id="selectPeriod"]/div/div[2]/div[2]/div[1]/select[2]/option[1]').click() #1日 29time.sleep(1) 30driver.find_element_by_xpath('//*[@id="selectPeriod"]/div/div[2]/div[2]/div[2]/select[2]/option[1]').click() #2018年 31time.sleep(1) 32driver.find_element_by_xpath('//*[@id="selectPeriod"]/div/div[2]/div[2]/div[1]/select[3]/option[3]').click() #3月 33time.sleep(1) 34driver.find_element_by_xpath('//*[@id="selectPeriod"]/div/div[2]/div[2]/div[1]/select[4]/option[31]').click() #31日 35time.sleep(1) 36#表示オプションを選ぶ 37driver.find_element_by_id('optionButton').click() 38time.sleep(1) 39driver.find_element_by_xpath('//*[@id="selectOp"]/div[1]/div/div[2]/p/label/input').click() 40time.sleep(1) 41driver.find_element_by_xpath('//*[@id="selectOp"]/div[2]/div/div[2]/p/label/input').click() 42time.sleep(1) 43driver.execute_script("window.scrollTo(0, document.body.scrollHeight);") #画面スクロール 44driver.find_element_by_xpath('//*[@id="selectOp"]/div[3]/p[1]/label/input').click() 45time.sleep(1) 46driver.find_element_by_xpath('//*[@id="リテラル"]').click() 47time.sleep(1) 48driver.find_element_by_xpath('// *[@id="selectOp"]/div[4]/div/div[2]/label/input').click() 49time.sleep(1) 50 51#地点を選ぶ 52driver.find_element_by_id('stationButton').click() 53time.sleep(1) 54 55 56select_list = ['東京', '小河内']#今回取得したい2地点 57driver.find_element_by_xpath('//*[@id="pr44"]').click()#東京都(pr44)を選択 58time.sleep(2) 59stations = driver.find_elements_by_xpath('//*[@class="station"]') 60 61time.sleep(1) 62for station in stations: 63 station.click() 64 time.sleep(2) 65 stname = station.find_element_by_name("stname").get_attribute("value") 66 #選択中の地点がselect_listになければ、その地点をスキップする 67 if not stname in select_list: 68 print(stname + " skip") 69 else: 70 driver.find_element_by_xpath('//*[@id="csvdl"]/img').click() #ボタンをクリックしてCSVをダウンロード 71 time.sleep(10) 72 print(stname + " DL") 73 #選択した地点を解除する 74 driver.find_element_by_id("deleteAllStPref").click() 75 time.sleep(2) 76 77driver.find_element_by_css_selector("#buttonSelectStation").click() 78time.sleep(5) 79print(stname)#確認用に最後の地点を表示 80 81

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2020/03/27 10:47

ダウンロードフォルダに保存されていませんか?
tohon

2020/03/30 00:07

ありがとうございます。すみません、ご返答が遅くなってしまいました。 ダウンロードフォルダを確認しましたが、やはりできておりませんでした。
guest

回答1

0

ベストアンサー

chromeをヘッドレスモードで使った場合、セキュリティの観点でダウンロードに制限があるという問題ですね。
これを解決するためにPage.setDownloadBehaviorをsend_commandする必要があります。
またこのダウンロード方法だとブラウザによるファイルのリネームが動いてくれず、
同じディレクトリだとdata.csvが上書きされてしまいますので、
地点毎にダウンロードディレクトリを変えてenable_download_in_headless_chrome関数を呼び出す方式を取っています。
今回のようにダウンロードファイル上書きのようなことがなければwebdriver.Chromeでchromedriver.exe呼んだ後に一回実行すれば本来は十分です。

python

1from selenium import webdriver 2from selenium.webdriver.chrome.options import Options 3import time 4import os 5 6#ダウンロードディレクトリ 7DOWNLOAD_PATH = os.path.dirname(os.path.abspath(__file__)) + '\download' 8 9#ダウンロードを実行するためにchromedriverにPage.setDownloadBehaviorをsend_commandでPOST送信する関数 10def enable_download_in_headless_chrome(driver, download_dir): 11 driver.command_executor._commands["send_command"] = ("POST", '/session/$sessionId/chromium/send_command') 12 params = {'cmd': 'Page.setDownloadBehavior', 'params': {'behavior': 'allow', 'downloadPath': download_dir}} 13 driver.execute("send_command", params) 14 15options = Options() 16options.add_argument('--headless') 17driver = webdriver.Chrome('C:/Program Files/chromedriver_win32/chromedriver.exe', options=options) 18・・・ 19for station in stations: 20 station.click() 21 time.sleep(2) 22 stname = station.find_element_by_name("stname").get_attribute("value") 23 #選択中の地点がselect_listになければ、その地点をスキップする 24 if not stname in select_list: 25 print(stname + " skip") 26 else: 27 #地点毎にダウンロードディレクトリを作成してsend_commandする 28 enable_download_in_headless_chrome(driver, DOWNLOAD_PATH + "\"+ stname) 29 30 driver.find_element_by_xpath('//*[@id="csvdl"]/img').click()#ボタンをクリックしてCSVをダウンロード 31 time.sleep(10) 32 print(stname + " DL") 33 #選択した地点を解除する 34 driver.find_element_by_id("deleteAllStPref").click() 35 time.sleep(2) 36・・・

投稿2020/03/27 14:41

編集2020/03/27 14:45
yureighost

総合スコア2183

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

tohon

2020/03/30 01:18

ありがとうございます! 添付いただいたコードでの実行を行いましたら、設定どおりのcsvファイルがダウンロードできました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問