BeautifulSoup4のfind_allでタグの中の文章が取得できない

Question

### 前提・実現したいこと犬猫上記で言う「犬」「猫」のような複数の要素を持つタグに含まれている、内容だけを取得したいです。※idやclassがありません。（本来は[こちら](http://yume-uranai.jp/keyword.php?keyword=%8C%A2&q=1)のソースを取得しています） ### 発生している問題・エラーメッセージ複数の該当する内容を取得したいので.find_all()を利用しています。詳細は該当のソースコードに記載しています。 ``` "ResultSet object has no attribute '%s'. You're probably treating a list of items like a single item. Did you call find_all() when you meant to call find()?" % key AttributeError: ResultSet object has no attribute 'text'. You're probably treating a list of items like a single item. Did you call find_all() when you meant to call find()? Exited with status 1 after 0.26 seconds ``` ### 該当のソースコード ```python3 import urllib.request from bs4 import BeautifulSoup html = urllib.request.urlopen("http://yume-uranai.jp/keyword.php?keyword=%8C%A2&q=1") soup = BeautifulSoup(html, "html.parser") title = soup.find_all("strong",style="color:#C84B00;font-size: 16px;") print(title.text) ``` ### 調べたこと [この質問](https://teratail.com/questions/110824)では、.stringの位置が違うんじゃないか？と言う回答が寄せられていました。 .stringは、.textと違い、1つの要素の時に使うものだと認識しております。（[こちら](http://irukanobox.blogspot.com/2016/06/beautifulsoup4textstring.html)を読みましたが、まだよく理解していません。とりあえず、.textが大味な意味で使える物と言う認識もしています。質問を参考に.textの位置を変えて見ました。 ``` title = soup.find_all("strong",style="color:#C84B00;font-size: 16px;".text) print(title) ``` もしくはこちらも ``` title = soup.find_all("strong",style="color:#C84B00;font-size: 16px;").text print(title) ``` どちらとも最初と同じエラーメッセージが出ます。しかし、print(title)を使わずに、このようにforで1つずつ取り出すと正しく中身だけを抜くことができました。 ``` for i in title: print(i.text) ``` 以下の参考にした記事全て、このようなfor文での書き方はしていません。 https://qiita.com/itkr/items/513318a9b5b92bd56185 https://qiita.com/connectcrew-ishii/items/6ad316ea854326c536a6 http://python.zombie-hunting-club.com/entry/2017/11/08/192731 僕の調べ方が悪いのか、また分からなさすぎて理解が足りていないだけなのか、恐らくその両方だと思いますが forを使わずに、find_allで文章だけ取得することは不可能なのでしょうか？僕はこの結果を配列に格納したいのですが、せっかくfind_allで取得した、タグも含まれている配列をfor文で出力しまた別の配列に入れなければなりません。最初から、find_allで中身だけ取り出せれば良い物だと思うのですが、全くやり方がわかりません。右も左も分からないレベルに初心者なので、エンジニアの方が想定している考え方が全くできていないと思いますが、ご回答していただければ幸いです。

Accepted Answer

`find_all`は複数の要素を返すので、forループを使うしかありません。
`.string`でも`.text`でも関係ありません。
提示URL`https://qiita.com/connectcrew-ishii/items/6ad316ea854326c536a6`でも、（selectで要素を取得していますが）実際の`text`を取得するさいはforループを利用しています。


> forを使わずに、find_allで文章だけ取得することは不可能なのでしょうか？
僕はこの結果を配列に格納したいのですが、せっかくfind_allで取得した、タグも含まれている配列をfor文で出力し
また別の配列に入れなければなりません。
最初から、find_allで中身だけ取り出せれば良い物だと思うのですが、全くやり方がわかりません。

以下でよいのではないでしょうか？

```Python
# 略
ret = []
for t in title:
    ret.append(t.text)
#ret = [t.text for t in title] # これでもよい

print(ret) # ['犬', '子犬', ～]
```

Answer

find_all(), find() に text 引数を指定することで、指定した値を持つ要素を検索できます。
この指定には正規表現が利用できるので、次のようにしてみてはどうでしょうか。

```python
import re
import urllib.request
from bs4 import BeautifulSoup

url = 'http://yume-uranai.jp/keyword.php?keyword=%8C%A2&q=1'
html = urllib.request.urlopen(url)
soup = BeautifulSoup(html, 'html.parser')

# 要素名が strong で値に犬または猫を含む要素を抽出
elems = soup.find_all('strong', text=re.compile('(犬|猫)'))

# 結果
for elem in elems:
    print(elem.string)
```

```
犬
子犬
犬に噛まれる
犬を飼う
犬と散歩する
大型犬
犬に吠えられる
犬と遊ぶ
犬を躾ける
愛犬
```