スクレイピング

回答率: 85.48%

質問するログイン新規登録

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

新規登録して質問してみよう

ただいま回答率: 85.48%

トップスクレイピングに関する質問

Q&A

解決済

1回答

1424閲覧

スクレイピング

総合スコア13

0グッド

1クリップ

投稿2018/11/03 05:16

編集2018/11/03 05:42

0

1

Qiitaを参考に、このサイト(https://tenki.jp/forecast/3/16/4410/13103/)をスクレイピングしよと思ったところ、このようなコードが使われていたのですがstringがどこから来ているのかわからないです。

python
1today = bsObj.find(class_="today-weather")
2weather = today.p.string

スクレイピングしたい部分を検証で見るとこんな感じです。

html
1<p class="weather-telop">晴</p>

追記　

python
1import requests
2from bs4 import BeautifulSoup
3#目的のＵＲＬ
4url = "https://tenki.jp/forecast/3/16/4410/13103/"
5
6#HTTPリクエスト
7r = requests.get(url)
8
9bsObj = BeautifulSoup(r.content,"html.parser")
10
11today = bsObj.find(class_="today-weather")
12weather = today.p.string
13
14#気温情報
15temp = today.div.find(class_="date-value-wrap")
16#＜dd＞タグを全て取り出す
17temp=temp.find_all("dd")
18#最高気温
19temp_max = temp[0].span.string
20#最高気温の前日比
21temp_max_diff = temp[1].string
22#最低気温
23temp_min = temp[2].span.string
24#最低気温の前日比
25temp_min_diff = temp[3].string
26
27print("天気:{}".format(weather))
28print("最高気温:{}{}".format(temp_max,temp_max_diff))
29print("最低気温:{}{}".format(temp_min,temp_min_diff))
30

2018/11/03 05:36

Pythonのソースはそれだけしか記述していないのでしょうか。他にソースがあるのであれば、追記していただけますか？

2018/11/03 05:42

追記させていただきました。宜しくお願いします！

2018/11/03 05:57

たびたびすみません。yutooo様が知りたいことは「晴」がなぜ表示されているのかでしょうか。それとも、today.p.stringの記述の意味が知りたいということでしょうか。

2018/11/03 06:02

いえ！こちらこそわかりずらくてすみません。。today.p.stringの記述の意味が知りたいです。

行動規範の内容に同意します

回答1件

0

ベストアンサー

today.p.stringの記述の意味について回答させていただきます。

python
1today = bsObj.find(class_="today-weather")

にて、オブジェクト取得している記載になります。

そして、

python
1today.p.string

にて、pタグの文字を取得している記述となります。

その為、

天気:晴
最高気温:19[-1]
最低気温:11[0]

が表示されています。

回答としては、pタグの文字取得です。

投稿2018/11/03 06:09

総合スコア64

2018/11/03 06:14

回答ありがとうございます！ということは、他サイトでスクレイピングをする時にもpタグの場合stringがつくということでしょうか？

2018/11/03 06:17 編集

取得したいものに合わせて選択という感じですね。文字列を取得したい場合には、stringですね。

2018/11/03 06:17

現状自分の頭だとtoday(オブジェクト取得）ｐ（取得するタグ）string(？)という感じです。

2018/11/03 06:21

なるほど！ありがとうございます！理解出来ました！文字列、数字そういった分け方なんですね。。お時間いただきありがとうございます！

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問

トップスクレイピングに関する質問

スクレイピング

関連した質問

同じタグがついた質問を見る

運営からのお知らせ

【サポート業務のお知らせ】ゴールデンウィーク休業につき下記の日程で、お問い合わせ等のサポート業務をお休みいたします。 2024/04/27(土)~2024/04/29(月) 2024/05/03(金)〜2024/05/06(月) なお期間中もサポートへのお問い合わせは受け付けております。

【重要なお知らせ】いつもteratailをご利用いただきありがとうございます。現在、認証システムの修正により、一部のユーザーが強制的にログアウトされる可能性がございます。お手数おかけしますが、再度ログインを行なっていただきますよう宜しくお願いいたします。ご不便をおかけし申し訳ございません。

過去のお知らせを見る