teratail header banner
teratail header banner
質問するログイン新規登録

回答編集履歴

2

import追加

2020/03/03 18:14

投稿

kairi003
kairi003

スコア1332

answer CHANGED
@@ -1,5 +1,7 @@
1
1
  reで正規表現しましょう。
2
2
  ```python
3
+ import re
4
+
3
5
  href = tag.get("href")
4
6
  if re.match(r'https://.+/Forum/ja/', href):
5
7
  print(herf)
@@ -13,6 +15,8 @@
13
15
 
14
16
  ただし、リンクがhttpsまで入った絶対パスで書いてあるとは限らないのでurllib.parse.urljoinで絶対パスにしたほうがいいと思います。
15
17
  ```python
18
+ from urllib.parse import urljoin
19
+
16
20
  href = urljoin(url, tag.get("href"))
17
21
  ```
18
22
 

1

追記

2020/03/03 18:14

投稿

kairi003
kairi003

スコア1332

answer CHANGED
@@ -14,4 +14,6 @@
14
14
  ただし、リンクがhttpsまで入った絶対パスで書いてあるとは限らないのでurllib.parse.urljoinで絶対パスにしたほうがいいと思います。
15
15
  ```python
16
16
  href = urljoin(url, tag.get("href"))
17
- ```
17
+ ```
18
+
19
+ 本当に左はhttps://まででいいんでしょうか?