日本語を含むURLをwebスクレイピングする際にうまくいかない(URLencode selenium python)

前提・実現したいこと

pythonでクローラーを作成しています。
動的なページが多いのでseleniumを使っています。
ターゲットとなるURLは日本語が含まれていることが多い

発生している問題・エラーメッセージ

日本語を含まないURLに対しては問題なく動くが、日本語を含むURLで行うと、htmlがうまく取得できない。
beautiful soupでfindしても全てがNoneObjectになってしまう

該当のソースコード

python
1from selenium.webdriver.chrome.options import Options
2from selenium import webdriver
3import bs4
4
5word = urllib.parse.quote_plus(word,encoding='utf-8')
6url = '該当URL/p=' + word
7options = Options()
8options.add_argument('--headless')
9options.add_argument('--disable-gpu')
10driver = webdriver.Chrome(chrome_options=options)
11driver.get(url)
12html = driver.page_source
13soup = bs4.BeautifulSoup(html,'lxml')

試したこと

日本語の部分を
urllib.parse.quote_plus(word,encoding='utf-8')
でURLencodeしたがダメだった

wordが日本語だとhtmlが取得できない
wordが英語だとちゃんとhtmlが取得できる

補足情報（FW/ツールのバージョンなど）

ここにより詳細な情報を記載してください。

行動規範の内容に同意します

回答1件

https://qiita.com/mix/items/87d094414e46f857de45

このような記事では解決できませんか？

投稿2018/03/18 10:45

mkgrei

総合スコア8560

python_love

2018/03/18 13:25

このqiitaの記事も結局はURLencodeをした文字列を元のURLにreplaceしているだけだと思うのですが、違いますでしょうか。実際、この方法でも出来ませんでした。 selenium特有の問題じゃないのかと思っています。

mkgrei

2018/03/18 15:01

おっしゃる通り、この記事は置き換えの方法が２，３個載っているだけです。今手元で試してみましたが、エンコード無しでchrome driverでうまくいきました。試したのはGoogle検索です。 OS, Python, seleniumなどのバージョンを追記してみてください。また、差し支えなければURLも。

行動規範の内容に同意します