前提・実現したいこと
beautifulsoupでwebページのスクレイピングをしています。
あるdivから、<br>などのタグをhtml形式として読み込んだ状態のテキストを取得したいです
(<br>とあったら、改行に変換して取得する)
どうすればいいでしょうか?
発生している問題
例えば下記のソースコードですと、DIVとBRの度に改行されるので、
ここで改行。 ここで改行。 ここで改行。 ここで改行。
という状態のテキストを取得したいです
該当のソースコード
<div class="test"> <DIV>ここで改行。</DIV><DIV>ここで改行。</DIV>ここで改行。<BR>ここで改行 </div>
試したこと
soup.find(class_="test")
→タグごと取得してしまう
soup.find(class_="test").text
→タグを消去して取得してしまう
回答3件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/08/18 15:38
2019/08/18 15:46 編集
2019/08/18 15:50
2019/08/18 16:04
2019/08/18 16:09