回答編集履歴

正規表現での方法

2020/05/03 00:18

投稿

glyzinieh

スコア222

answer CHANGED Viewed

@@ -19,4 +19,28 @@
 大文字小文字は区別される（以降で説明する文字列のメソッドでも同様）。
 正規表現を使ってもできますが、モジュールをimportしなければいけないことなど、少し面倒なところがあると思ったので、inを使いました。
-正規表現の方が良い場合は、コメントいただければ幸いです。
+正規表現の方が良い場合は、コメントいただければ幸いです。
+### 正規表現の方法（追記１）
+```Python
+import os
+import re
+省略
+for i in range(len(tags)):
+    filepath = "{}.pdf".format(i)
+    target = tags[i]["href"]
+    if re.match(r'J_TrafficReport_(.+).pdf',os.path.basename(target)):
+        url_1 = urljoin(base, target)
+        request = urllib.request.Request(url=url_1, headers=headers)
+        with open(filepath, "wb") as f:
+            f.write(urllib.request.urlopen(request).read())
+```
+#### 参考にさせていただいたサイト
+[Pythonでパス文字列からファイル名・フォルダ名・拡張子を取得、結合](https://note.nkmk.me/python-os-basename-dirname-split-splitext/)
+> ファイル名を取得: os.path.basename()
+パス文字列からファイル名を取得するにはos.path.basename()を使う。
+[書きながら覚えよう！Pythonで正規表現を使う方法【初心者向け】](https://techacademy.jp/magazine/15635)
+[Pythonの正規表現マッチオブジェクトでマッチした文字列や位置を取得](https://note.nkmk.me/python-re-match-object-span-group/)
+> ブール値としての扱い（if文での使い方）
+マッチオブジェクトはブール値として判定される場合は常にTrueとして扱われる。