聞きたいこと
以下のPythonコードでいくつか聞きたい事があります。
1.必要なPythonパッケージがもう1つあると思ってて、「datetime」かなと思うんですがどうでしょうか?
2.➀に入るコードは何だと思いますか?
3.「start = time.time()」と「print('{:.5f}'.format(time.time() - start))」って部分のコードはそれぞれどういう意味を表しているんでしょうか?
「start = time.time()」は、以降のコードを処理する開始時間だと思ってますが、もう一方の「print('{:.5f}'.format(time.time() - start))」がどういう動きをしているのかわかりません。恐らく時間を表しているんでしょうが・・・。
4.クローリングに必要な情報を取得しているコードは「r = requests.get(URI)」で間違いないですか?
該当のソースコード
Python
1import requests 2import time 3from bs4 import BeautifulSoup 4 5def get_detail(URI): 6 r = requests.get(URI) 7 soup = BeautifulSoup(r.content, 8 'lxml', 9 from_encoding="utf-8") 10 11 print(soup.find(class_="mainTitleBook").get_text(), '\n', 12 soup.find(itemprop="author").get_text(), '\n', 13 soup.find(itemprop="offers").get_text(), '\n', 14 soup.find(itemprop="isbn").get_text(), '\n') 15 16if __name__ == "__main__": 17 BASE_URI = 'https://gihyo.jp' 18 19 start = time.time() 20 r = requests.get(BASE_URI + '/book/genre?s=0802') 21 22 while True: 23 soup = BeautifulSoup(r.content, 24 'lxml', 25 from_encoding="utf-8") 26 for b in soup.find_all(class_='data'): 27 get_detail(BASE_URI + b.find("a").get("href")) 28 29 next_url = soup.find(class_="next").a 30 if next_url is None: 31 [ ➀ ] 32 33 r = requests.get(BASE_URI + next_url.get("href")) 34 35 print('{:.5f}'.format(time.time() - start))
補足情報
初めてこのサイトを使うので分かりにくい質問だと思います。
伝わりづらい部分は聞いて下さると助かります。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。