質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Beautiful Soup

Beautiful Soupは、Pythonのライブラリの一つ。スクレイピングに特化しています。HTMLデータの構文の解析を行うために、HTMLタグ/CSSのセレクタで抽出する部分を指定することが可能です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

Q&A

2回答

2799閲覧

複数回find_allを使う場合にエラーが発生

pikachu1

総合スコア9

Beautiful Soup

Beautiful Soupは、Pythonのライブラリの一つ。スクレイピングに特化しています。HTMLデータの構文の解析を行うために、HTMLタグ/CSSのセレクタで抽出する部分を指定することが可能です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

0グッド

0クリップ

投稿2021/05/14 06:55

編集2021/05/14 07:19

前提・実現したいこと

python初心者です。検索エンジンやECサイトでのスクレイピングによる情報収集を試みております。
検索結果にでてきたページタイトルを広告を避けつつ取得したいため、find、find_allを複数回使用した
コードを実行しているのですが下記のにエラーが出てしまいます。
対処法や、コードの間違いなどご存じの方いらっしゃいましたら教えていただけませんでしょうか。
1つ目のfindで検索結果全体の情報を取得
直後のfind_allでリスティング広告などを除いた各検索結果を取得
最後のfind_allでページタイトルが入ったタグの情報を取得という具合となっております。

発生している問題・エラーメッセージ

AttributeError Traceback (most recent call last) <ipython-input-29-f0571655c0ec> in <module> 9 a = soup.find(class_='s-main-slot s-result-list s-search-results sg-row') 10 b = a.find_all(class_='sg-col-4-of-12 s-result-item s-asin sg-col-4-of-16 sg-col sg-col-4-of-20') ---> 11 c = b.find_all(class_='a-size-base-plus a-color-base a-text-normal') 12 c ~\Anaconda3\lib\site-packages\bs4\element.py in __getattr__(self, key) 2171 def __getattr__(self, key): 2172 """Raise a helpful exception to explain a common code fix.""" -> 2173 raise AttributeError( 2174 "ResultSet object has no attribute '%s'. You're probably treating a list of elements like a single element. Did you call find_all() when you meant to call find()?" % key 2175 ) AttributeError: ResultSet object has no attribute 'find_all'. You're probably treating a list of elements like a single element. Did you call find_all() when you meant to call find()?

該当のソースコード

url="該当のURL" browser.get(url) browser.implicitly_wait(10) r = browser.page_source # browser.quit() soup=BeautifulSoup(r,features='lxml') r = browser.page_source soup=BeautifulSoup(r,features='lxml') a = soup.find(class_='s-main-slot s-result-list s-search-results sg-row') b = a.find_all(class_='sg-col-4-of-12 s-result-item s-asin sg-col-4-of-16 sg-col sg-col-4-of-20') c = b.find_all(class_='a-size-base-plus a-color-base a-text-normal') c

試したこと

findやfind_allのほかにselectなども用いてみましたがやはり同様のエラーが出てしまいます。

補足情報(FW/ツールのバージョンなど)

環境はこのような感じです

from selenium import webdriver
from selenium.webdriver.common.alert import Alert
import time
import pandas as pd
from selenium.webdriver.common.keys import Keys
import os
import glob
import chromedriver_binary
import requests
from bs4 import BeautifulSoup

また、商品タイトルが格納されているタグのclass名はどの検索結果も同じなので、一度広告以外の検索結果に絞るためにfind_allを2回使う必要がある状態です

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

y_waiwai

2021/05/14 07:08

エラーメッセージに出てるコードとあなたの提示してるコードが違います そこらへんきちんと提示しましょう
pikachu1

2021/05/14 07:24

失礼いたしました。コードを更新いたしました。 お時間があればご確認いただけますでしょうか
guest

回答2

0

bの型はbs4.element.ResultSet'なので、find_allはできません。

python

1a = soup.find(class_='s-main-slot s-result-list s-search-results sg-row') 2b = a.find_all(class_='sg-col-4-of-12 s-result-item s-asin sg-col-4-of-16 sg-col sg-col-4-of-20') 3for tag in b: 4 c = b.find_all(class_='a-size-base-plus a-color-base a-text-normal')

なら何かしら動くでしょう。

urlを開示せず、その他の説明もない状況では、これ以上のことはわかりません。

投稿2021/05/14 10:00

ppaul

総合スコア24666

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

0

b = a.find_all(...

このbにはfind_allというアトリビュートはない、とおっしゃってます。
b にはなにが入ってるのか見てみよう。

投稿2021/05/14 07:24

y_waiwai

総合スコア87774

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問