BeautifulSoup4を用いてサイト要素の取得を行いたい（class要素がないので取得ができない）

前提・実現したいこと

BeautifulSoup4を用いて以下、サイトの要素を取得しDateFrameを活用してタイトルをindex、月日を列、タイトルを行とした表を作成したい。

<div class="box_title info">
<a href="/hogehoge/01">タイトル01</a>
<span class="info">8月31日</span>
</div>,
<div class="box_title info">
<a href="/hogehoge/02">タイトル02</a>
<span class="info">8月7日</span>
</div>,
<div class="box_title with-info">
<a href="/hogehoge/03">タイトル03</a>
<span class="info">8月2日</span>
</div>

※前提として、各ライブラリーのimportを行い以下を実行し上記のHtml要素を取得している。

url = "https://hogehoge"
response = req.urlopen(url)

parse_html = BeautifulSoup(response,'html.parser')

title_lists = parse_html.find_all('div', class_='box_title')

上記行った結果表題に記載しているhtml要素を取得しました。
0. 月日に関しては以下実行しprintにて表示確認できたのですが

Date = parse_html.find_all('span', class_='info')
Date[1:4]

表示結果

[<span class="info">8月31日</span>,
 <span class="info">8月7日</span>,
 <span class="info">8月2日</span>]

発生している問題

２. aタグのテキストデータを取得しようと模索しているのですがうまく要素の取得ができない状況でfindで単一要素の取得はできるもののaタグ全てのテキストが取得できない状況です。

試したこと

title_lists = parse_html.find_all('div', class_='box_title')
a = div.find("a")
print(p.string)

エラーメッセージ
NameError: name 'div' is not defined

以下のように試したものの一つの値しか取得できずfind_allするのかな....と思ってます。

parse_html.find('div', class_='box_title').find_all('a')

この辺で詰まって頭打ちになっております。

補足情報（FW/ツールのバージョンなど）

ここにより詳細な情報を記載してください。

otn

2020/08/10 09:53

プログラムとデータが一致してないので、どちらを信じて良い物やら。

WorkingAtSinjuk

2020/08/10 10:05

ご回答ありがとうございます！失礼いたしました。以下が正しいですね....。 ``` title_lists = parse_html.find_all('div', class_='box_title') a = div.find("a") print(p.string) parse_html.find('div', class_='box_title').find_all('a') ```

otn

2020/08/10 10:07 編集

ここに書くのじゃ無くて、質問を修正しましょう。他の部分もクラス名が間違ってます。

行動規範の内容に同意します

回答1件

ベストアンサー

find_allするのはaじゃなくてdivですね。その一つ一つのdivに対してfind("a")します。

投稿2020/08/10 09:58

otn

総合スコア85901

WorkingAtSinjuk

2020/08/10 10:07

早速ありがとうございます！ title_lists = parse_html.find_all('div', class_='box_title').find('a') とすると以下のエラーになってしまい.... ResultSet object has no attribute 'find'. You're probably treating a list of elements like a single element. Did you call find_all() when you meant to call find()?