質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

88.58%

IndexError: list index out of rangeのエラーについて

解決済

回答 1

投稿

  • 評価
  • クリップ 1
  • VIEW 1,003

gon_gon_tarou

score 15

 前提・実現したいこと

webスクレイピングで、サッカーのクラブチームの情報をまとめたいです。
https://www.jleague.jp/

 発生している問題・エラーメッセージ

IndexError: list index out of range

 該当のソースコード

import csv
from urllib.request import urlopen
from bs4 import BeautifulSoup

#URLの指定
html = urlopen("https://www.jleague.jp/sp/club/sapporo/day/#player")
bsObj = BeautifulSoup(html, "html.parser")

#テーブルを指定
table = bsObj.findAll("table",{"class":"playerDataTable"})[0]
rows = table.findAll("tr")

csvFile = open("player.csv", 'wt', newline = '', encoding = 'utf-8')
writer = csv.writer(csvFile)

try:
    for row in rows:
        csvRow = []
        for cell in row.findAll(['td', 'th']):
            csvRow.append(cell.get_text())
        writer.writerow(csvRow)
finally:
    csvFile.close()

 試したこと

utfを変えてみた
if文を追加した

 補足情報(FW/ツールのバージョンなど)

使ったサイト
https://www.jleague.jp/sp/club/sapporo/day/#player

Python 3.6.4 :: Anaconda, Inc.

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • y_waiwai

    2018/11/23 21:22

    で、しつもんはなんでしょうか

    キャンセル

  • gon_gon_tarou

    2018/11/23 21:55

    返信ありがとうございます。 https://www.jleague.jp/sp/club/sapporo/day/#playerの ページにあるプレイヤーリストをエラーなく、csvファイルにして出力したいです

    キャンセル

回答 1

checkベストアンサー

+1

選手の一覧は後からJavascriptでレンダリングされているためデータがありません。
Javascriptを実行してからでないとスクレイピングできません。

Javascriptを実行するには

  1. seleniumでJavascriptをレンダリングしてから実行
  2. scrapy-splashでJavascriptをレンダリングしてから実行
  3. requests-htmlでJavascriptをレンダリングしてから実行

の3種類あり一番簡単な3.requests-htmlで書きます。

Anacondaでrequests-htmlを検索しましたがないようでしたのでpipでインストールしてください
https://anaconda.org/search?q=requests-html

 インストール

pip install requests-html

 使い方

https://html.python-requests.org/

 プログラム

import csv
from requests_html import HTMLSession

session = HTMLSession()
r = session.get('https://www.jleague.jp/sp/club/sapporo/day/#player')

# Javascriptレンダリング
r.html.render()

with open('player.csv', 'w') as fw:
    writer = csv.writer(fw, dialect='excel', lineterminator='\n')

    for trs in r.html.find('#loadArea > section > table > tbody > tr'):
        result = [td.text.replace('\n', '') for td in trs.find('td')]
        writer.writerow(result)

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/11/24 01:14

    ありがとうございます!

    無事解決いたしました。本当に感謝です。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 88.58%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る