質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

260閲覧

python 繰り返し処理でできた複数のリストを一つのリストにするには

dd_

総合スコア111

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2021/07/27 08:39

python

1from bs4 import BeautifulSoup 2import requests 3 4urls = [] 5for i in range(1, 6): 6 urls.append('https://xxx.jq/page-{}'.format(i)) 7#スクレイピングしたいURLのページが5つあったとして、5つのURLを作成します。 8#urlの中身を実行すると['https://xxx.jq/page-1', 'https://xxx.jq/page-2', 'https://xxx.jq/page-3', 'https://xxx.jq/page-4', 'https://xxx.jq/page-5'] 9 10for url in urls: 11 r = requests.get(url) 12 soup = BeautifulSoup(r.text,'html.parser') 13 title = soup.find_all(class_="title") 14#htmlのtitleのクラスを抽出し 15 16 title_list = [x.text for x in title] 17#そこからテキストのみを取り出したいのでこちらのコードを書きました。 18 print(title_list) 19

続行結果

['取り出したテキスト1', '取り出したテキスト2', 取り出したテキスト3'] #https://xxx.jq/page-1から取り出したテキスト ['取り出したテキスト4', '取り出したテキスト5', 取り出したテキスト6'] #https://xxx.jq/page-2から取り出したテキスト ['取り出したテキスト7', '取り出したテキスト8', 取り出したテキスト9'] #https://xxx.jq/page-3から取り出したテキスト ['取り出したテキスト10', '取り出したテキスト11', 取り出したテキスト12'] #https://xxx.jq/page-4から取り出したテキスト ['取り出したテキスト13', '取り出したテキスト14', 取り出したテキスト15'] #https://xxx.jq/page-5から取り出したテキスト

このようにリストが5つになってしまいます。

こちらを一つのリストにして中身のテキストを
最初に取り出したものを最初として
順番に並べるにはどういったコードがありますでしょうか?
教えていただけると幸いです。よろしくお願いいたします。

実際の私の方で取り出したテキストに番号はふられていません。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

順番に追加していけばよいです。

pythnon

1for url in urls: 2 r = requests.get(url) 3 soup = BeautifulSoup(r.text,'html.parser') 4 title = soup.find_all(class_="title") 5#htmlのtitleのクラスを抽出し 6 7 title_list = [x.text for x in title] 8#そこからテキストのみを取り出したいのでこちらのコードを書きました。 9 print(title_list)

python

1title_list = [] 2 3for url in urls: 4 r = requests.get(url) 5 soup = BeautifulSoup(r.text,'html.parser') 6 title = soup.find_all(class_="title") 7#htmlのtitleのクラスを抽出し 8 9 title_list.extend([x.text for x in title]) 10#そこからテキストのみを取り出したいのでこちらのコードを書きました。 11 12print(title_list)

としましょう。

投稿2021/07/27 08:50

ppaul

総合スコア24670

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問