質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

URL

URL(ユニフォームリソースロケータ)とは、インターネット上のリソース(Webページや電子メールの宛先等)を特定するための形式的な記号の並びの事を言う。

検索

検索は、あるデータの集まりの中から 目的のデータを見つけ出すことです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

2回答

2054閲覧

pythonで電車発車時刻をスクレイピングしたい

prof

総合スコア179

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

URL

URL(ユニフォームリソースロケータ)とは、インターネット上のリソース(Webページや電子メールの宛先等)を特定するための形式的な記号の並びの事を言う。

検索

検索は、あるデータの集まりの中から 目的のデータを見つけ出すことです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/08/17 08:55

なぜか、始発の時間が出力されてしまいます。
ヤフー乗換案内を使っています。本来は最寄り駅ですが、仮として東京から品川にしています。

urlのformatによる代入までは正しくできているのですが、おそらくrequestsがうまくいってないようです。
解決策お願い致します。

Python

1 2from bs4 import BeautifulSoup 3import requests 4import time 5import datetime 6 7today = datetime.datetime.now() 8 9hour = today.hour 10minute = today.minute 11mi = str(minute) 12m1 = int(mi[0]) 13m2 = int(mi[1]) 14year = today.year 15month = today.month 16day = today.day 17print(today) 18url = "https://transit.yahoo.co.jp/search/result?flatlon=&fromgid=&from=%E6%9D%B1%E4%BA%AC&tlatlon=&togid=&to=%E5%93%81%E5%B7%9D&viacode=&via=&viacode=&via=&viacode=&via=&y={}&m={}&d={}&hh={}&m2={}&m1={}&type=1&ticket=ic&expkind=1&ws=3&s=0&al=1&shin=1&ex=1&hb=1&lb=1&sr=1&kw=%E5%93%81%E5%B7%9D".format(year,month,day,hour,m2,m1) 19response = requests.get(url) 20#response.encoding = response.apparent_encoding 21soup = BeautifulSoup(response.content,"html.parser") 22 23roots = soup.find_all("li",class_="time") 24for i in range(1,4,1): 25 print(roots[i].get_text()[0:11]) 26

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

状況が不明なので一般論です。

まず、希望のHTMLが取得できているか確認します。print(response.content)

これが希望のHTMLでない場合(希望のデータが含まれない場合)は、
・JavaScriptで動的にHTMLを生成している
・フレームを使っている
のどちらか(or両方)です。
JavaScriptで生成している場合は、requests.getでは取得できないので、
何らかのブラウザ + Selenium + webdriver等を使います。

希望のHTMLの場合(希望のデータが含まれる場合)は、HTMLをよくみて、要素を指定します。

投稿2020/08/17 09:18

otn

総合スコア84555

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

自己解決

python

1from bs4 import BeautifulSoup 2import requests 3import time 4import datetime 5 6today = datetime.datetime.now() 7 8hour = today.hour 9minute = today.minute 10mi = str(minute) 11m1 = int(mi[0]) 12m2 = int(mi[1]) 13year = today.year 14month = today.month 15day = today.day 16print(today) 17url = "https://transit.yahoo.co.jp/search/result?flatlon=&fromgid=&from=%E6%9D%B1%E4%BA%AC&tlatlon=&togid=&to=%E5%93%81%E5%B7%9D&viacode=&via=&viacode=&via=&viacode=&via=&y={}&m={}&d={}&hh={}&m2={}&m1={}&type=1&ticket=ic&expkind=1&ws=3&s=0&al=1&shin=1&ex=1&hb=1&lb=1&sr=1&kw=%E5%93%81%E5%B7%9D".format(year,str(month).zfill(2),day,hour,m2,m1) 18print(url) 19response = requests.get(url) 20#response.encoding = response.apparent_encoding 21soup = BeautifulSoup(response.content,"html.parser") 22 23roots = soup.find_all("li",class_="time") 24for i in range(1,4,1): 25 print(roots[i].get_text()[0:11]) 26

投稿2020/08/17 09:17

prof

総合スコア179

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問