🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

Q&A

1回答

1319閲覧

PythonのSeleniumで要素が無いテキストの抽出

退会済みユーザー

退会済みユーザー

総合スコア0

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

0グッド

0クリップ

投稿2021/02/05 09:40

編集2021/02/05 09:54

前提・実現したいこと

PythonのSeleniumでデータの抽出を作成しています。

Python

1[print(i, item) for i, item in enumerate(item_list)]

上記を実行後に以下のようにしたいのですが、うまくできませんでした。
良い方法を教えていただけますでしょうか。

0 ['hogehoge-1', '¥9,000']
1 ['hogehoge-1SS', '¥13,500']
2 ['hogehoge-2', '¥12,000']
3 ['hogehoge-2SS', '¥18,000']
4 ['hogehoge-3', '¥13,000']
[None, None, None, None, None]

該当のソースコード

Python

1from selenium.webdriver.chrome.options import Options 2from selenium import webdriver 3import chromedriver_binary 4import time 5 6options = Options() 7options.add_argument('--incognito') 8options.add_argument('--blink-settings=imagesEnabled=false') 9driver = webdriver.Chrome(chrome_options=options) 10driver.implicitly_wait(60) 11driver.get("https://www.hogehoge.com/") 12time.sleep(3) 13 14from datetime import datetime 15import openpyxl as px 16from openpyxl.styles import PatternFill 17from bs4 import BeautifulSoup as bs4 18import re 19 20def Pagecrawling(soup, item_list): 21 ### ※1 22 products = soup.find_all('div', class_=re.compile('item_info_area')) 23 ### ※1 24 for product in products: 25 Knumber = product.find_all('p', class_=re.compile('pronumber')) 26 Kprice = product.find_all('em', ) 27 for (numnum, pripri) in zip (Knumber, Kprice): 28 number = numnum.get_text().replace('\n', '') 29 price = pripri.get_text() 30 item_list.append([number, price]) 31 return item_list 32 33r = driver.page_source 34soup = bs4(r,'lxml') 35item_list = [] 36item_list = Pagecrawling(soup, item_list) 37 38### ※2 39[print(i, item) for i, item in enumerate(item_list)] 40### ※2

### ※1で抽出されるデータ

[<div class="item_info_area"> <div> <p class="pronumber">品番</p>hogehoge-1<br/> <p class="price">価格(税別) </p><em>¥9,000</em> </div> </div>, <div class="item_info_area"> <div> <p class="pronumber">品番</p>hogehoge-1SS<br/> <p class="price">価格(税別) </p><em>¥13,500</em> </div> </div>, <div class="item_info_area"> <div> <p class="pronumber">品番</p>hogehoge-2<br/> <p class="price">価格(税別) </p><em>¥12,000</em> </div> </div>, <div class="item_info_area"> <div> <p class="pronumber">品番</p>hogehoge-2SS<br/> <p class="price">価格(税別) </p><em>¥18,000</em> </div> </div>, <div class="item_info_area"> <div> <p class="pronumber">品番</p>hogehoge-3<br/> <p class="price">価格(税別) </p><em>¥13,000</em> </div> </div>, <div class="item_info_area"> </div>]

### ※2で出力されるデータ

###見やすくするためのコメント### 0 ['品番', '¥9,000'] 1 ['品番', '¥13,500'] 2 ['品番', '¥12,000'] 3 ['品番', '¥18,000'] 4 ['品番', '¥13,000'] [None, None, None, None, None]

試した内容

上記をヒントに

for product in products: Kprice = product.find_all(class_="pronumber").text print(Kprice)

としてみましたが

Traceback (most recent call last): File "<stdin>", line 2, in <module> File "C:\Users\hogehoge\AppData\Local\Programs\Python\Python38-32\lib\site-packages\bs4\element.py", line 2173, in __getattr__ raise AttributeError( AttributeError: ResultSet object has no attribute 'text'. You're probably treating a list of elements like a single element. Did you call find_all() when you meant to call find()?

とエラーが返ってきました。

補足情報(FW/ツールのバージョンなど)

  • Python 3.8.7(32bit)
  • ChromeDriver 87.0.4280.20
  • 必要のない宣言がありますが、記載したコード以降で使いますので気にしないでください。
  • パソコンスキルの教科書様のサイトを参考にコードを作成しました。

ttp://fastclassinfo.com/entry/yahooauction_python/

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

[print(i, item) for i, item in enumerate(item_list)]

print()の値はNoneなので、Noneのリストが出来ます。
リストのリストにしたいのなら、

Python

1[[i, item] for i, item in enumerate(item_list)]

です。

投稿2021/02/05 10:27

otn

総合スコア85893

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2021/02/07 23:56

回答ありがとうございます。 記載したソースコード以降でファイル出力するのですがどこにもNoneはおらず、 Noneの存在意義が分からなかったのですが疑問が解けました、大変勉強になります。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問