質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

347閲覧

Pythonの繰り返し文に関して(スクレイピング関連)

mathing

総合スコア19

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

1クリップ

投稿2018/01/16 12:14

SOUP.select("#id_name > ol > li > span")[0].get("カスタムデータ属性")

上記コードの[0]の場所を[1]や[2]と変えるとそれぞれ異なったデータを取得することができます。

print(SOUP.select("#id_name > ol > li > span")[0].get("カスタムデータ属性")) print(SOUP.select("#id_name > ol > li > span")[1].get("カスタムデータ属性")) print(SOUP.select("#id_name > ol > li > span")[2].get("カスタムデータ属性")) ...

上のように何度も書くことなく繰り返し文を作り、リストの中に全て納め、最後にまとめてprintを行いたいのですがうまくいきませんでした。
解決方法はないでしょうか?
お願いします。

現在のコード from time import sleep import urllib.request as REQ from bs4 import BeautifulSoup URL = "省略します" HTML = REQ.urlopen(URL) SOUP = BeautifulSoup(HTML, "html.parser") print(SOUP.select("#id_name > ol > li > span")[0].get("カスタムデータ属性"))
試してみたコード from time import sleep import urllib.request as REQ from bs4 import BeautifulSoup URL = "省略します" HTML = REQ.urlopen(URL) SOUP = BeautifulSoup(HTML, "html.parser") NAMES = [] for index in SOUP.select("#id_named > ol > li > span").get("カスタムデータ属性"): NAMES.append(index) print(NAMES)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

カウンタのiをぶん回せば良いかと思います。

Python

1NAMES = [] 2for i in range(3): 3 NAMES.append(SOUP.select("#id_named > ol > li > span")[i].get("カスタムデータ属性"))

内包表記でもいいです。

Python

1NAMES = [SOUP.select("#id_named > ol > li > span")[i].get("カスタムデータ属性") for i in range(3)]

コメントを受けて

日頃スクレイピングをしないものでちょっと自信がないですが、こう書けるんじゃないかなぁ。

Python

1NAMES = [elem.get("カスタムデータ属性") for elem in SOUP.select("#id_named > ol > li > span")]

IndexErrorをキャッチする強引な手法もあるっちゃあります。

投稿2018/01/16 12:17

編集2018/01/16 13:08
LouiS0616

総合スコア35658

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

mathing

2018/01/16 12:35

LouiS0616さん。 ありがとうございます! for文の使い方を間違えていました。 基礎中の基礎の事でも親切に教えてくださり感謝しております。 また、先日は違う質問にもお答えいただきありがとうございました。
mathing

2018/01/16 13:03 編集

申し訳ございません。 今回の質問に関連した内容のご質問が1つうまれたのでここに追加でお聞きできればと思います。 range()の()内の数値は、150と事前に分かっていたので問題はありませんでした。 ですが、もし分からない場合はいくつを指定するのでしょうか? 試しに151としたらエラーが返ってきました。 IndexError: list index out of range 例えばなのですが適当に多めに(999など)と記入して余ったら処理しないなどはできますか?
LouiS0616

2018/01/16 13:08

思いついたことを追記しました。もし嘘を書いていたらすみません。
mathing

2018/01/16 13:17

LouiS0616さん。 追記でいただいたコードでうまく機能しました。 本当にありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問