質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
Beautiful Soup

Beautiful Soupは、Pythonのライブラリの一つ。スクレイピングに特化しています。HTMLデータの構文の解析を行うために、HTMLタグ/CSSのセレクタで抽出する部分を指定することが可能です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

4813閲覧

Python BeautifulSoupで複数あるテーブルから特定のテーブルの中の狙った値を取得したい

kazumaru555

総合スコア1

Beautiful Soup

Beautiful Soupは、Pythonのライブラリの一つ。スクレイピングに特化しています。HTMLデータの構文の解析を行うために、HTMLタグ/CSSのセレクタで抽出する部分を指定することが可能です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

1クリップ

投稿2020/09/17 14:27

編集2020/09/17 22:54

前提・実現したいこと

◆複数のテーブルがあるサイトから特定のテーブルの特定の値を抽出したいです。

◆対象サイト
https://www.himawari.metro.tokyo.jp/qq13/qqport/tomintop/detail/fk1100.php?sisetuid=1130200720&kinouid=fk9920

◆対象のテーブル
下表から、「水晶体再建術(白内障)」と「緑内障」の値である「1,378」「17」を抽出したいです。
イメージ説明

発生している問題・エラーメッセージ

BeautifulSoupで下記のテーブルを含むデータは抽出できましたが、その後print(td[5]などで値を取得できず狙ったtd値を取得できません。

[<table class="hospital-detail-table-05" summary="眼領域一覧"> <thead> <tr> <th scope="col">項目名</th> <th scope="col">前年度件数</th> <th scope="col">項目名</th> <th scope="col">前年度件数</th> </tr> </thead> <tbody> <tr> <th scope="row">眼領域の一次診療</th> <td>-</td> <th scope="row">(糖尿病性網膜症に対する)光凝固療法</th> <td>-</td> </tr> <tr> <th scope="row">糖尿病による眼合併症の診断と治療</th> <td>-</td> <th scope="row">(糖尿病性網膜症に対する)硝子体手術</th> <td>-</td> </tr> <tr> <th scope="row">硝子体手術</th> <td>-</td> <th scope="row">斜視手術</th> <td>-</td> </tr> <tr> <th scope="row">水晶体再建術(白内障手術)</th> <td>-</td> <th scope="row">眼瞼下垂症手術</th> <td>-</td> </tr> <tr> <th scope="row">緑内障手術</th> <td>-</td> <th scope="row">小児視力障害診療</th> <td>-</td> </tr> <tr> <th scope="row">網膜光凝固術(網膜剥離手術)</th> <td>-</td> <th scope="row">眼底網膜疾患</th> <td>-</td> </tr> </tbody> </table>]

言語
python google colab

ソースコード

from bs4 import BeautifulSoup import requests url="https://www.himawari.metro.tokyo.jp/qq13/qqport/tomintop/detail/fk1100.php?sisetuid=1130200720&kinouid=fk9920" res = requests.get(url) soup = BeautifulSoup(res.text, "html.parser") elems = soup.find_all(summary="眼領域一覧") print(elems) print(td[5])

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

otn

2020/09/17 15:53

> 該当テーブルを含むデータは抽出できましたが、 どんなデータですか? リストで得られているなら、ループして探すだけでは?
kazumaru555

2020/09/17 22:46

取得した該当テーブルを追記しました。 特定のtd値を取得したいのですが、うまくいかず苦戦しています。
guest

回答1

0

ベストアンサー

下記でいかがでしょう。
必ず同じインデックスのtdを見に行くので大丈夫であれば、という感じですが。

python3

1from bs4 import BeautifulSoup 2import requests 3url="https://www.himawari.metro.tokyo.jp/qq13/qqport/tomintop/detail/fk1100.php?sisetuid=1130200720&kinouid=fk9920" 4res = requests.get(url) 5 6soup = BeautifulSoup(res.text, "html.parser") 7elems = soup.find_all(summary="眼領域一覧") 8# print(elems[0]) 9tds = elems[0].find_all("td") 10print(tds) 11# [<td>-</td>, <td>-</td>, <td>-</td>, <td>-</td>, <td>849</td>, <td>3</td>, <td>1,378</td>, <td>-</td>, <td>17</td>, <td>-</td>, <td>490</td>, <td></td>] 12print(tds[6].get_text()) 13# 1,378

投稿2020/09/17 23:07

jeanbiego

総合スコア3966

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

kazumaru555

2020/09/17 23:13

すごい! ありがとうございます。 tds = elems[0].find_all("td") でさらにtdを全て取得できるんですね。 解決しました。 本当にありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問