python
1from bs4 import BeautifulSoup 2import requests 3 4urls = [] 5for i in range(1, 6): 6 urls.append('https://xxx.jq/page-{}'.format(i)) 7#スクレイピングしたいURLのページが5つあったとして、5つのURLを作成します。 8#urlの中身を実行すると['https://xxx.jq/page-1', 'https://xxx.jq/page-2', 'https://xxx.jq/page-3', 'https://xxx.jq/page-4', 'https://xxx.jq/page-5'] 9 10for url in urls: 11 r = requests.get(url) 12 soup = BeautifulSoup(r.text,'html.parser') 13 title = soup.find_all(class_="title") 14#htmlのtitleのクラスを抽出し 15 16 title_list = [x.text for x in title] 17#そこからテキストのみを取り出したいのでこちらのコードを書きました。 18 print(title_list) 19
続行結果
['取り出したテキスト1', '取り出したテキスト2', 取り出したテキスト3'] #https://xxx.jq/page-1から取り出したテキスト ['取り出したテキスト4', '取り出したテキスト5', 取り出したテキスト6'] #https://xxx.jq/page-2から取り出したテキスト ['取り出したテキスト7', '取り出したテキスト8', 取り出したテキスト9'] #https://xxx.jq/page-3から取り出したテキスト ['取り出したテキスト10', '取り出したテキスト11', 取り出したテキスト12'] #https://xxx.jq/page-4から取り出したテキスト ['取り出したテキスト13', '取り出したテキスト14', 取り出したテキスト15'] #https://xxx.jq/page-5から取り出したテキスト
このようにリストが5つになってしまいます。
こちらを一つのリストにして中身のテキストを
最初に取り出したものを最初として
順番に並べるにはどういったコードがありますでしょうか?
教えていただけると幸いです。よろしくお願いいたします。
実際の私の方で取り出したテキストに番号はふられていません。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。