前提・実現したいこと
ここに質問の内容を詳しく書いてください。
pythonを使ったスクレイピングで取得したテキストのリスト内で、指定した文字列を含む要素から、指定した文字列を含む要素までのテキストを抽出したいです。
例えば、スタートという文字列を含む要素が出たら次にゴールという文字列を含む要素が出るまでのテキストを抽出したいです。
スタートがある文字列を取得できましたが、スタートからゴールまでの範囲を指定して抽出するにはどうしたらいいでしょうか。
###該当のソースコード
python
1import requests 2from bs4 import BeautifulSoup 3 4url =" " 5html = requests.get(url) 6soup = BeautifulSoup(html.content,"html.parser") 7list = soup.find(id=" ").text 8 9all_text_list = list.split("\n") 10 11for text in all_text_list: 12 if "スタート" in text: 13 print(text) 14
試したこと
python
1for text in all_text_list: 2 if "スタート" in text: 3 print(text) 4 for text in all_text_list: 5 if "ゴール" in text: 6 break
としてみました思った通りに出力しませんでした。他の解決策が浮かびません。
補足情報(FW/ツールのバージョンなど)
ここからスタート
・・・
(間のテキスト)
・・・
ここがゴール
といった出力になるようにしたいです。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/10/16 05:08 編集