前提・実現したいこと
下記のdata-minute="08"の08をテキストデータとして取得したいですができません。
<div class="TickerEvent SecondEvent TeamA Goal even " data-eventid="-2147074643" data-minute="08" data-second="33" data-eventtype="91" data-shotposition="1" data-result="4" id="event_-2147074643"> </div>
ページは以下のURLです。
https://ticker.ehfcl.com/202211020101002#
発生している問題・エラーメッセージ
div classやidのスクレイピングはできるのですが、 data-minuteの扱いがわからず、取得できません
試したこと
一度、contentsとして取得後、テキストに変換し、該当部分のみ取得しようとしましたが、
'NavigableString' object has no attribute 'text'のエラーが出てしまいました。
このエラーは調べても解決できませんでした。
コードは以下の通りです。
from bs4 import BeautifulSoup as bs from requests_html import HTMLSession import pandas as pd import time import re url = "https://ticker.ehfcl.com/202211020101002" session = HTMLSession() resp = session.get(url) resp.html.render(timeout=20, keep_page=True) soup = bs(resp.html.html, "html.parser") pbpinfo = soup.find_all("div", class_="Ticker") for pbp in pbpinfo: phases = pbp.find_all("div", class_="TickerEvents") for event in phases: p = r'data-minute="(.*)' data_minute = event.contents for dm in data_minute: dm = dm.text print(dm) dm2 = re.search(p, dm) minutes.append(dm2.group(1))
補足情報(FW/ツールのバージョンなど)
ここにより詳細な情報を記載してください。
あなたの回答
tips
プレビュー