Python スクレイピング find_all 使用時の listへの代入方法

スクレイピング時に特定のタグが複数ある場合のlistへの代入方法を教えてください。

変数に入っているテーブルの情報をcsvに書き込みしたい
上記の例を参考にPタグだけをCSVに表示する事が出来ました。

応用で、複数のURLでニュース名を入れて、Pタグ（複数あるタグ）も同じようにCSVへ表示しようと思い下記のコードを思いつきました。
今回は、例でPタグの７番目だけを取得して、CSVに表示できれば、その応用で８番目９番目と増やせると思いましたが、find_all 使用時のlistへの代入方法が理解しておらず、上手くいきません。

Python
1from bs4 import BeautifulSoup
2from urllib import request
3import csv
4import pandas as pd
5
6he6list = []
7namelist = []
8
9for i in range(3):
10    url = f'https://news.yahoo.co.jp/pickup/' + f'{6375460 + i}'.zfill(7)
11    print(url)
12
13    response = request.urlopen(url)
14    soup = BeautifulSoup(response)
15
16    #　ニュース名
17    name = soup.find('p', class_='sc-hENMEE lnXRKU')
18    print(name)
19    namelist.append(name.text)
20    
21    #　p要素を抜き出す 今回は例で7番目のみ
22    he = [tag.string for tag in soup.find_all("p")]
23    print(he[6])　
24    he6 = he[6]
25    he6list.append(he6.text)
26    
27response.close()
28
29#　CVS出力するための準備
30df_pp = pd.DataFrame.from_dict({'ニュース名':namelist, 'he6':he6list}, orient='index').T
31
32print(df_pp)

エラーコード

AttributeError                            Traceback (most recent call last)
<ipython-input-37-ff705a6eb246> in <module>
     23     print(he[6])
     24     he6 = he[6]
---> 25     he6list.append(he6.text)
     26 
     27 response.close()

~\anaconda3\lib\site-packages\bs4\element.py in __getattr__(self, attr)
    914             return self
    915         else:
--> 916             raise AttributeError(
    917                 "'%s' object has no attribute '%s'" % (
    918                     self.__class__.__name__, attr))

AttributeError: 'NavigableString' object has no attribute 'text'


                                                 ニュース名 he6
0   アップル、11月11日に特別イベント「One more thing.」--Appleシリコン...   　
1                                                None   ア
2                                                None   ッ
3                                                None   プ
4                                                None   ル
..                                                ...  ..
74                                               None   れ
75                                               None   て
76                                               None   い
77                                               None   る
78                                               None   。

[79 rows x 2 columns]

CSVで表示したいこと

　　ニュース名　　he6
0 アップル～略～　アップルは日本時間～略～
1　ＤｅＮＡ～略～　Pの7番目
2　「エンジン～略～　Pの7番目

ニュース名まででしたら、以前質問に答えていただき進むことが出来ましたが、
findとfind_allの違いにより壁にぶつかっております。

どのようにコードを修正すればいいでしょうか？
よろしくお願いいたします。

行動規範の内容に同意します

回答1件

ベストアンサー

he6list.append(he6.text)において、he6はタグから文字列をもってきたオブジェクトなので.textには対応していません。というか.textつけなくても既に文字列相当ですから。
.textを消せば動作はするようですよ。（結果がお望みのものかはさておき）

投稿2020/11/09 05:04

jeanbiego

総合スコア3966

ooyuki

2020/11/09 05:20

早速のご返答ありがとうございます。上の方で付けていたので、そのまま.textをつけておりました。 .textを外すとエラーメッセージが消えて希望するCSVになりそうです。ありがとうございます。

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.31%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

Python スクレイピング find_all 使用時の listへの代入方法

関連した質問