NYダウのデータの過去データを、スクレイピングで取り込みたい
対象のURL
https://finance.yahoo.com/quote/%5EDJI/history?p=%5EDJI
■■対象のURLのOpen、High、Low、Close、Volumeの値を、当日から過去までスクレイピングでCSVに出力したいのですが、
デベロッパーツールに表示されているコードを指定しても、値がうまく指定できません。
■■Yahooニュースなどは思った通りに書き出せるのですが、対象のサイトはどうやってクラスとIDを指定すればいいのかわかりません
(記載はないのですが、もしかしてスクレイピング防止のためでしょうか?)
■■下記、デベロッパーツールに表示されているもので、自分が指定したクラス
Yahooニュース等のソースコードにはなかったのですが、タグに「%」や「px」が入っています。
こういったソースコードの場合、何か特別な処理が必要なのでしょうか?
例)
<div class="Pb(10px) Ovx(a) W(100%)" data-reactid="32"> <span data-reactid="55">34,757.57</span> など発生している問題・エラーメッセージ
何日も調べて何日もハマってます。。どなたか教えてください。
AttributeError: 'NoneType' object has no attribute 'find_all' または None と出力される
該当のソースコード
python
1import requests 2from bs4 import BeautifulSoup 3 4try: 5 load_url = "https://finance.yahoo.com/quote/%5EDJI/history?p=%5EDJI" 6 html = requests.get(load_url) 7 soup = BeautifulSoup(html.content, "html.parser") 8except: 9 print("ページが見つかりません") 10 11topic = soup.find(class_="Pb(10px) Ovx(a) W(100%)") 12for element in topic.find_all("span"): 13 print(element.text) 14
補足情報(FW/ツールのバージョンなど)
Jupyter Notebook
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。