質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Beautiful Soup

Beautiful Soupは、Pythonのライブラリの一つ。スクレイピングに特化しています。HTMLデータの構文の解析を行うために、HTMLタグ/CSSのセレクタで抽出する部分を指定することが可能です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

3回答

1598閲覧

seleniumにてスクレイピングを実行したところエラーがでる。

k0gane

総合スコア10

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Beautiful Soup

Beautiful Soupは、Pythonのライブラリの一つ。スクレイピングに特化しています。HTMLデータの構文の解析を行うために、HTMLタグ/CSSのセレクタで抽出する部分を指定することが可能です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/05/02 04:10

編集2020/05/02 08:48

前提・実現したいこと

https://stellabms.xyz/s/sl/1 というサイトから表データを取得したいが、それを囲っているdivしか取得できません。

発生している問題・エラーメッセージ

raise exception_class(message, screen, stacktrace) selenium.common.exceptions.StaleElementReferenceException: Message: The element reference of <div class="normal-container"> is stale; either the element is no longer attached to the DOM, it is not in the current frame context, or the document has been refreshed

該当のソースコード

python

1from selenium import webdriver 2from selenium.webdriver.firefox.firefox_binary import FirefoxBinary 3 4song_id = 1 #1からどんどん加算していって存在するまで取得したい 5 6while True: 7 sl_URL = "https://stellabms.xyz/s/sl/" + str(song_id) 8 driver.get(sl_URL) 9 sl = driver.find_elements_by_tag_name("div") 10 sl_hrefs = [s.get_attribute("href") for s in sl] 11 for i in sl_hrefs: 12 print(driver.get(i)) 13

試したこと

各種方法等についてQiitaやteratailなど参照しましたが問題が解決しませんでした。

補足情報(FW/ツールのバージョンなど)

Python==3.7.3

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

k0gane

2020/05/02 04:59

追記に書いたんですけどbeautifulsoup4は最新版です
guest

回答3

0

ajaxでデータ表示してるっぽいからこういうの参考にしたら良いんじゃないですかね。
https://qiita.com/gtaiyou24/items/21d7d3b539c43e6616a6

投稿2020/05/02 05:12

gentaro

総合スコア8949

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

k0gane

2020/05/02 08:48

seleniumを採用したところ色々とエラーがでてしまったのでもしよろしければご教授願いたいです
gentaro

2020/05/02 09:06

それは試したことと出たエラーの詳細をちゃんと書いて質問を建ててください。
guest

0

表のAタグのhref の取得例です

Python

1# サイトにアクセス 2from selenium import webdriver 3from time import sleep 4 5driver = webdriver.Chrome() 6 7song_id = 1 #1からどんどん加算していって存在するまで取得したい 8 9while True: 10 sl_URL = "https://stellabms.xyz/s/sl/" + str(song_id) 11 driver.get(sl_URL) 12 sleep(3) 13 try: 14 driver.find_element_by_class_name('ant-notification-notice-close').click() 15 sleep(3) 16 17 driver.execute_script("let xpath = '//*[contains(text(), \"OK\")]';var nodesSnapshot = document.evaluate(xpath,document,null,XPathResult.ORDERED_NODE_SNAPSHOT_TYPE,null);nodesSnapshot.snapshotItem(0).click();") 18 sleep(3) 19 except: 20 pass 21 22 sl = driver.find_elements_by_class_name("normal-table")[0] 23 sl_hrefs = [s.get_attribute("href") for s in sl.find_elements_by_tag_name('a')] 24 s2_hrefs = [] 25 for i in sl_hrefs: 26 if i is not None: 27 s2_hrefs.append(i) 28 for i in s2_hrefs: 29 print(i) 30 #driver.get(i) 31 32 song_id += 1

投稿2020/05/23 12:36

編集2020/05/23 12:41
Reach

総合スコア733

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

当方の環境では、r.dataは

HTML

1<!--一部省略--> 2<body><noscript>You need to enable JavaScript to run this app.</noscript> 3 <div id="root"></div> 4 <script> 5 <!--省略--> 6 </script> 7 <script src="./static/js/2.faba7e4a.chunk.js"></script> 8 <script src="./static/js/main.f2d8bba6.chunk.js"></script> 9</body>

となっていて、You need to enable JavaScript to run this app.(このアプリを実行するには、JavaScriptを有効にする必要があります。(google翻訳))と書かれているので、JavaScriptが実行できないようです。

環境の違いなどはあると思いますが、参考になれば幸いです。

投稿2020/05/02 05:21

glyzinieh

総合スコア208

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問