質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Beautiful Soup

Beautiful Soupは、Pythonのライブラリの一つ。スクレイピングに特化しています。HTMLデータの構文の解析を行うために、HTMLタグ/CSSのセレクタで抽出する部分を指定することが可能です。

for

for文は、様々なプログラミング言語で使われている制御構造です。for文に定義している条件から外れるまで、for文内の命令文を繰り返し実行します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

3回答

3203閲覧

list index out of rangeの対処法

TaikiKajiura

総合スコア1

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Beautiful Soup

Beautiful Soupは、Pythonのライブラリの一つ。スクレイピングに特化しています。HTMLデータの構文の解析を行うために、HTMLタグ/CSSのセレクタで抽出する部分を指定することが可能です。

for

for文は、様々なプログラミング言語で使われている制御構造です。for文に定義している条件から外れるまで、for文内の命令文を繰り返し実行します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2021/04/07 07:49

python初心者で勉強中です。
IndexError: list index out of range
が改善出来ません。

区分により、要素に加減があるからと思いますが、この場合は、
if文で解決するのでしょうか?
どの様に改善するのかご教授頂けると幸いです。

また、もっとこうやって書いた方が
便利だよ、簡略化出来るよ!
等ありましたら、是非よろしくお願いします。

python

1import requests 2from bs4 import BeautifulSoup 3 4url = 'https://ranking-deli.jp/fuzoku/style6/9/' 5headers = { 6 "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.114 Safari/537.36" 7} 8res=requests.get(url,headers = headers) 9soup = BeautifulSoup(res.content,'html.parser') 10 11data=[] 12ranks=soup.find_all('section',attrs={'class':'f-shopList'}) 13for rank in ranks: 14 15 rank_num=int(rank.find('i',attrs={'class':'head-rank'}).text) 16 rank_shop=rank.find('a',attrs={'class':'head-shopName'}).text 17 rank_shop_link=rank.find('a').get('href') 18 head_areaGenre=rank.find('span',attrs={'class':'head-areaGenre'}).text.split('/') 19 tiiki=head_areaGenre[0].strip() 20 style=head_areaGenre[1].strip() 21 22 23 rank_topic=rank.find('span',attrs={'class':'head-reviewCount'}) 24 rank_Commuting=rank.find('span',attrs={'class':'head-schedule-count'}) 25 info_right=rank.find_all('p',attrs={'class':'info-item'}) 26 info_right_access=info_right[0].text 27 info_right_access_1=info_right[1].text 28 info_right_time=info_right[2].text 29 info_right_tel=info_right[3].text 30 31 info_tug=rank.find_all('p',attrs={'class':'info-concept-item'}) 32 info_tug_0=info_tug[0].text 33 info_tug_1=info_tug[1].text 34 35 36 datum={} 37 datum['順位']=rank_num 38 datum['店名']=rank_shop 39 datum['リンク']=rank_shop_link 40 datum['地域']=tiiki 41 datum['形態']=style 42 datum['口コミ']=rank_topic 43 datum['出勤']=rank_Commuting 44 datum['場所']=info_right_access 45 datum['最寄り駅']=info_right_access_1 46 datum['営業時間']=info_right_time 47 datum['タグ1']=info_tug_0 48 datum['タグ2']=info_tug_1 49 datum['電話']=info_right_tel 50 data.append(datum) 51 52 import pandas as pd 53 54 df=pd.DataFrame(data) 55 df 56 57 # df.to_csv('駅ちか.csv',index=False)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

皆さんありがとうございます。
解決しました

投稿2021/04/12 23:01

TaikiKajiura

総合スコア1

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

ベストアンサー

配列の中身を見る時に、配列の数を確認すると良いと思います。
今回のケースだと、info_right[]の配列で、データがない箇所にアクセスしているようでした。

例えば、以下のようにです。29行目付近です。

python

1 if ( len(info_right) > 3): 2 info_right_tel=info_right[3].text

投稿2021/04/08 16:54

退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

print文を入れて、head_areaGenreとinfo_rightとinfo_tugのlengthを確認しましょう。
どれかの長さが足りないなら、そういう場合を除外するようにif文を入れましょう。

投稿2021/04/07 07:57

ppaul

総合スコア24666

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

TaikiKajiura

2021/04/07 08:48

①、 if len(info_right)<=3: print('') if len(head_areaGenre)<=2: print('') if len(info_tug)<=2: print('') これを追加してみたのですが、47行目移行が表示されなくなってしまい下記エラーが消えません。。 IndexError: list index out of range ②、 rank_topic=rank.find('span',attrs={'class':'head-reviewCount'}) rank_Commuting=rank.find('span',attrs={'class':'head-schedule-count'}) NoneTypeが返ってくる場合もあるので、こちらの二行に.extract())を加えても動か無いので、下記の様に書いてみましたが、動きません。。 if rank_topic is None: print('-') else: print(rank.find('span',attrs={'class':'head-reviewCount'}).extract()) どの様な保応報がございますでしょうか。。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問