teratail header banner
teratail header banner
質問するログイン新規登録

回答編集履歴

1

訂正

2020/10/13 05:54

投稿

nto
nto

スコア1438

answer CHANGED
@@ -8,19 +8,27 @@
8
8
  自動でPDFファイルをブラウザのPDFリーダー機能でPDFを表示しているだけであり
9
9
  PDFは決してページではありません。
10
10
 
11
- さて本題のPDFの保存方法についてですが
11
+ さて本題のPDFの保存方法についてですが
12
- ファイルの保存はurllibライブラリを使用して行います。
13
12
  `urllib.request.urlretrieve(保存したいURL, 保存先)`の容量で保存が可能です。
13
+ 今回質問者様は、質問内容に掲載されているコードで`print(geturl)`とありましたが
14
+ geturlという変数が特に定義されていなければこれではエラーが出るでしょう。
15
+ また`url = 'https://i02.smp.ne.jp/u/mutb_img/{0:%Y%m%d}.pdf'.format(now)`
16
+ とされていらっしゃいましたが実際にprint(url)として出力されたURLは存在しているという事なのでしょうか?
14
- 以下サンプルコードなります。
17
+ 存在している場合に正常動作する思います。
15
18
 
19
+ 保存時のファイル名にその時の時刻を挿入したいという事であれば以下のサンプルコードで可能です。
20
+
16
21
  ```python
17
22
  import requests
18
23
  from bs4 import BeautifulSoup
19
24
  import urllib
20
25
  import os
26
+ import datetime
21
27
 
28
+
22
29
  pdflink = 'https://www.hogefuga.com/sample.pdf'
30
+ now = datetime.datetime.now()
23
- filename = 'sample.pdf' # 保存したい名前
31
+ filename = '{0:%Y%m%d}.pdf'.format(now) # 保存したい名前
24
32
  currentdir = os.getcwd() # 保存先を定義(左記の場合はカレントディレクトリ)
25
33
  # 保存先とファイル名を結合
26
34
  savepath = os.path.join(currentdir, filename)