質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

2回答

231閲覧

リストから特定の文字を条件に抽出する処理をforでループさせたい

pesta

総合スコア21

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2019/07/06 10:03

前提・実現したいこと

【前提】
python初心者です。
お手柔らかにお願いします。
ご不明な点等ありましたら迅速に回答しますのでご助力のほどよろしくお願いいたします。

【実現したいこと】
特定の文字を条件に抽出する処理をforでループさせたい

発生している問題・エラーメッセージ

IndexError Traceback (most recent call last) <ipython-input-115-9728897de535> in <module>() 10 print(type(tags[0])) 11 for tag in tags: ---> 12 print (tag.select("a")[0].get("href")) IndexError: list index out of range

該当のソースコード(全体)

from bs4 import BeautifulSoup import requests as rq keyword='プログラミング' html_orgin = rq.get('https://www.google.co.jp/search?num=10&q=' +keyword).text soup = BeautifulSoup(html_orgin, 'html.parser') tags = soup.find_all('div',{'class':'jfp3ef'}) print(len(tags)) #出力→36 print(type(tags[0])) #出力→<class 'bs4.element.Tag'> for tag in tags: print (tag.select("a")[0].get("href"))

上記コード実行結果

36 <class 'bs4.element.Tag'> /url?q=https://www.sejuku.net/blog/2100&sa=U&ved=2ahUKEwjM8OqxgaDjAhVHE6YKHce-Bw0QFjAAegQICRAB&usg=AOvVaw10tcKqr94eEhAiHqo1Wee9 /url?q=https://www.sejuku.net/blog/diagnose/%3Fcid%3Dsp_bar_red&sa=U&ved=2ahUKEwjM8OqxgaDjAhVHE6YKHce-Bw0Q0gIwAHoECAkQAw&usg=AOvVaw3k9bMAztgIpnftAlwx8E13 --------------------------------------------------------------------------- IndexError Traceback (most recent call last) <ipython-input-115-9728897de535> in <module>() 10 print(type(tags[0])) 11 for tag in tags: ---> 12 print (tag.select("a")[0].get("href")) IndexError: list index out of range

途中まではループ処理されていると思うのですが・・
ご助力お願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

tagaタグが含まれていない場合があると提示エラーが発生します。
以下のように含まれているかチェックすることでエラー回避できます。

Python

1# 略 2for tag in tags: 3 ancs = tag.select("a") 4 if ancs: 5 print (ancs[0].get("href"))

なおgoogleでは機械的な検索(スクレイピング)は規約で禁止されていたと思うのでご注意ください。

投稿2019/07/06 10:09

can110

総合スコア38262

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

pesta

2019/07/06 10:21

ご回答ありがとうございます。 上記コードでエラー回避できました! ご配慮ありがとうございます、規約、読んできます。
guest

0

上記の回答者の方と同じですが、以下のように.findでtypeを確認するとNoneTypeがでてくるので、aタグがなく.get()が使えないことが分かります。例外処理を入れるなどするとクリアできるかと思います。

python

1for tag in tags: 2 t = tag.select("a") 3 print(type(t))

投稿2019/07/06 10:25

YugoNakashima

総合スコア42

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問