質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Django

DjangoはPythonで書かれた、オープンソースウェブアプリケーションのフレームワークです。複雑なデータベースを扱うウェブサイトを開発する際に必要な労力を減らす為にデザインされました。

Chrome

Google Chromeは携帯、テレビ、デスクトップなどの様々なプラットフォームで利用できるウェブブラウザです。Googleが開発したもので、Blink (レンダリングエンジン) とアプリケーションフレームワークを使用しています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

Q&A

解決済

1回答

2464閲覧

Djangoでseleniumを使うとエラーが出る

sakanaku

総合スコア17

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Django

DjangoはPythonで書かれた、オープンソースウェブアプリケーションのフレームワークです。複雑なデータベースを扱うウェブサイトを開発する際に必要な労力を減らす為にデザインされました。

Chrome

Google Chromeは携帯、テレビ、デスクトップなどの様々なプラットフォームで利用できるウェブブラウザです。Googleが開発したもので、Blink (レンダリングエンジン) とアプリケーションフレームワークを使用しています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

0グッド

0クリップ

投稿2020/08/30 09:24

前提・実現したいこと

Djangoでseleniumを使うと下記のようなエラーがでてしまいます。ブラウザで使っているgooglechromeのバージョンとchromedriver_binaryのバージョンはしっかり合わせれているようです。なぜこのようなエラーが出てしまうのでしょうか??ぜひ教えていただきたいです。
よろしくお願いします。

発生している問題・エラーメッセージ

Traceback (most recent call last): File "/Users/.local/share/virtualenvs/wo-kkDshSZx/lib/python3.8/site-packages/django/core/handlers/exception.py", line 47, in inner response = get_response(request) File "/Users/.local/share/virtualenvs/wo-kkDshSZx/lib/python3.8/site-packages/django/core/handlers/base.py", line 179, in _get_response response = wrapped_callback(request, *callback_args, **callback_kwargs) File "/Users/newswo/ws/views.py", line 33, in listfunc ul_tag = driver.find_elements_by_css_selector(selector) File "/Users/local/share/virtualenvs/wo-kkDshSZx/lib/python3.8/site-packages/selenium/webdriver/remote/webdriver.py", line 614, in find_elements_by_css_selector return self.find_elements(by=By.CSS_SELECTOR, value=css_selector) File "/Users/.local/share/virtualenvs/wo-kkDshSZx/lib/python3.8/site-packages/selenium/webdriver/remote/webdriver.py", line 1005, in find_elements return self.execute(Command.FIND_ELEMENTS, { File "/Users/.local/share/virtualenvs/wo-kkDshSZx/lib/python3.8/site-packages/selenium/webdriver/remote/webdriver.py", line 321, in execute self.error_handler.check_response(response) File "/Users/.local/share/virtualenvs/wo-kkDshSZx/lib/python3.8/site-packages/selenium/webdriver/remote/errorhandler.py", line 242, in check_response raise exception_class(message, screen, stacktrace) selenium.common.exceptions.InvalidArgumentException: Message: invalid argument: 'value' must be a string (Session info: headless chrome=84.0.4147.135)

該当のソースコード

from django.shortcuts import render from django.views.generic import CreateView from django.urls import reverse_lazy import urllib.request from .models import Post from .models import News from selenium import webdriver import chromedriver_binary from selenium.webdriver.common.keys import Keys from selenium.webdriver.chrome.options import Options import requests options = Options() options.headless = True options.add_argument('--headless') class Create(CreateView): template_name = 'home.html' model = News fields = ('url',) success_url = reverse_lazy('list') def listfunc(request): for post in News.objects.all(): url = post.url list = [] driver = webdriver.Chrome(options=options) selector = driver.get("動的なwebサイト") ul_tag = driver.find_elements_by_css_selector(selector) for tag in ul_tag[0]: title = tag.a.getText() url2 = tag.a.get("href") list.append([title, url2]) context = {'list': list, } return render(request, 'list.html', context)

補足情報(FW/ツールのバージョンなど)

mac10.15.3
Python3.8.5
Django3.1

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

python

1 driver = webdriver.Chrome(options=options) 2 selector = driver.get("動的なwebサイト") 3 4 ul_tag = driver.find_elements_by_css_selector(selector)

そもそも、find_elements_by_css_selectorの使い方が間違っています。

https://www.seleniumqref.com/api/python/element_get/Python_find_element_by_css_selector.html

find_elements_by_css_selectorのパラメータには、文字列でcssセレクタを指定しましょう。

投稿2020/08/31 01:44

t_obara

総合スコア5488

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

sakanaku

2020/08/31 03:01

文字列でcssセレクタを指定しましたら以下のエラーは改善されました。ありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問