質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Chrome

Google Chromeは携帯、テレビ、デスクトップなどの様々なプラットフォームで利用できるウェブブラウザです。Googleが開発したもので、Blink (レンダリングエンジン) とアプリケーションフレームワークを使用しています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

4回答

3400閲覧

Chrome DriverでPermission Errorの改善方法を教えて下さい。

hirahashi

総合スコア30

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Chrome

Google Chromeは携帯、テレビ、デスクトップなどの様々なプラットフォームで利用できるウェブブラウザです。Googleが開発したもので、Blink (レンダリングエンジン) とアプリケーションフレームワークを使用しています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/02/01 09:42

編集2020/02/01 12:31

Qiitaに載ってあったソースコードをそのままコピー
したら以下のようなエラーが発生しました。内容はDアニメストアをスクレイピング
して人気ランキングを作るというものです。
URLは
リンク内容
です。エラーの内容は、白い画像が一瞬でてきてすぐに消えるというものです。
chromedriver.exeをフルパスで指定しました。

発生している問題・エラーメッセージ

Traceback (most recent call last):
File "C:/Users/PycharmProjects/sampleproject2/helloworld3.py", line 12, in <module>
driver = webdriver.Chrome(executable_path=r"C:\Users\PycharmProjects\sampleproject2\chromedriver.exe")
File "C:\Users\AppData\Local\Programs\Python\Python36-32\lib\site-packages\selenium\webdriver\chrome\webdriver.py", line 81, in init
desired_capabilities=desired_capabilities)
File "C:\Users\AppData\Local\Programs\Python\Python36-32\lib\site-packages\selenium\webdriver\remote\webdriver.py", line 157, in init
self.start_session(capabilities, browser_profile)
File "C:\Users\AppData\Local\Programs\Python\Python36-32\lib\site-packages\selenium\webdriver\remote\webdriver.py", line 252, in start_session
response = self.execute(Command.NEW_SESSION, parameters)
File "C:\Users\AppData\Local\Programs\Python\Python36-32\lib\site-packages\selenium\webdriver\remote\webdriver.py", line 321, in execute
self.error_handler.check_response(response)
File "C:\Users\AppData\Local\Programs\Python\Python36-32\lib\site-packages\selenium\webdriver\remote\errorhandler.py", line 242, in check_response
raise exception_class(message, screen, stacktrace)
selenium.common.exceptions.SessionNotCreatedException: Message: session not created: This version of ChromeDriver only supports Chrome version 80

該当のソースコード

from selenium import webdriver from bs4 import BeautifulSoup from time import sleep import csv # リンク文字列 hiragana_list = [ "あ", "い", "う", "え", "お", "か", "き", "く", "け", "こ", "さ", "し", "す", "せ", "そ", "た", "ち", "つ", "て", "と", "な", "に", "ぬ", "ね", "の", "は", "ひ", "ふ", "へ", "ほ", "ま", "み", "む", "め", "も", "や", "ゆ", "よ", "ら", "り", "る", "れ", "ろ", "わ", "を", "ん" ] driver = webdriver.Chrome(executable_path=r"C:\Users\PycharmProjects\sampleproject2\chromedriver.exe") driver.get("https://anime.dmkt-sp.jp/animestore/c_all_pc?initialCollectionKey=1") results = {} for hiragana in hiragana_list: # 最初のアクセス時以外、五十音順にクリックで遷移 if hiragana != "あ": continue_link = driver.find_element_by_link_text(hiragana) continue_link.click() html01 = driver.page_source # 最後までページスクロール while 1: driver.execute_script("window.scrollTo(0, document.body.scrollHeight);") sleep(1) html02 = driver.page_source if html01 != html02: html01 = html02 else: break soup = BeautifulSoup(html01, "html.parser") titleAndFavoriteCounts = soup.find_all(class_='textContainerIn') # {アニメタイトル: ファボ数} for titleAndFavoriteCount in titleAndFavoriteCounts: title = titleAndFavoriteCount.find(class_='ui-clamp webkit2LineClamp').get_text() favoriteCount = int(titleAndFavoriteCount.find(class_='favoriteCount').get_text()) results[title] = favoriteCount driver.close() driver.quit() sorted_results = {} # 降順にソート for k, v in sorted(results.items(), key=lambda x: x[1], reverse=True): sorted_results[k] = v field_names = ['anime_title', 'favorite_count'] # csv出力 with open("anime_ranking.csv", "w") as f: writer = csv.writer(f, delimiter=';') # ヘッダー writer.writerow(field_names) # 各行 for anime_title, favorite_count in sorted_results.items(): writer.writerow((anime_title, favorite_count))

補足情報
hiragana_listとanime_titleとanime_ranking
のアンダーバーの前に波線がかかっております。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2020/02/01 09:49

リンクは「リンクの挿入」で記入してください。
otn

2020/02/01 10:36

エラーメッセージは? 画像でなく、テキストでコピペしてください。
can110

2020/02/01 12:37

回答を受けてコードを修正したなど質問を修正する場合は、質問と回答の内容がずれてしまわないように、元の質問内容に追記するようにしてください。
hirahashi

2020/02/01 12:53

元の質問内容は消さない方がよろしいでしょうか?
can110

2020/02/01 13:02

はい。 後からこの質問を読んだ人が「質問に対して回答が合っていないんじゃない?」と混乱してしまうので。
hirahashi

2020/02/01 13:08

分かりました。以後気を付けます。
guest

回答4

0

ベストアンサー

executable_pathは、ディレクトリじゃなくてexeファイルのフルパスを書いてください。

投稿2020/02/01 11:20

otn

総合スコア84423

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

otn

2020/02/01 11:55

> 空のrank.exeというファイルを作成しました。 意味不明です。 chromedriver.exe のフルパスを指定します。
otn

2020/02/01 12:32 編集

> This version of ChromeDriver only supports Chrome version 80 ChromeとChromedriverのバージョンが合ってない。 つまり、間違ったChromedriverをダウンロードしてしまった。
guest

0

Chrome Driverのパスは、保存先のディレクトリではなく実行ファイル名をフルパスで与えてください。

なお、情報は画像ではなくテキストで提示ください。そうすることでナレッジとして蓄積されます。
Googleselenium アクセスが拒否されましたと検索するとすぐに以下が見つかります。
PermissionError: [WinError 5] アクセスが拒否されました。 エラーの意味が分かりません PYTHON

投稿2020/02/01 11:01

can110

総合スコア38233

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

hirahashi

2020/02/01 12:01 編集

ご回答ありがとうございます。 今はhelloworld3.pyというファイルで当コードを動かしている のですが、それをexeファイルにするのでしょうか? https://techacademy.jp/magazine/18963 このURLのサイトを見て、実行しようとしていますが、 正しいでしょうか?
can110

2020/02/01 12:10

いえ。 ダウンロードして、どこかのディレクトリ内に置いた(はずの)「ChromeDriver.exe」という実行ファイル名をフルパスで与えてください。具体的なパス例は回答のリンク先を参照ください。
guest

0

下記のパス部分は実際のパスを入力してください。

driver = webdriver.Chrome(executable_path="chromeドライバの保存先パス")

投稿2020/02/01 09:52

meg_

総合スコア10577

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

>driver = webdriver.Chrome(executable_path="chromeドライバの保存先パス")

サンプルコードをそのままコピペしてはいけません。
あなたの環境に合わせて、保存先のパスを指定してください。

投稿2020/02/01 09:51

technocore

総合スコア7200

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

hirahashi

2020/02/01 09:59

ご回答ありがとうございます。"chromeドライバの保存先パス"に ディレクトリをいれました。しかし、 SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape というエラーがでます。
technocore

2020/02/01 10:06

質問するときは実際にあなたが書いたコードを掲示しましょう。 フォルダのパス文字列に「¥」が含まれるときはエスケープしてください。 executable_path = "C:¥¥dir1¥¥dir2" RAW文字列を使うとエスケープせず普通に書けるので打ち間違いを減らせて便利です。 executable_path = r"C:¥dir1¥dir2"
hirahashi

2020/02/01 10:30

PathをRAW文字列を使うか\を2つではさむか したのですが、やはりエラーがでます。 ここでは書ききれないので編集しました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問