質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

1117閲覧

相対URLを絶対URLに変換した後、実行結果で確認したい場合

dd_

総合スコア111

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2021/08/03 16:48

スクレイピングで取得した相対URLを
絶対URLに変換したいということで
下のコードを書きました

python

1title_urls_list = [] 2#for文と.extendで作られた相対URLが複数入ったリスト 3 4 5import urllib.parse 6 7for title_url in title_urls_list: 8 urllib.parse.urljoin("https://hogehoge.com", title_url)

こちらのコードはエラーが出ず実行できました。
結合されたか確認したのですが
どういったコードが良いでしょうか?
教えていただけると幸いです。
宜しくお願い致します。

試しに書いてみたコード

python

1 2title_urls_list = [] 3#for文と.extendで作られた相対URLが複数入ったリスト 4 5import urllib.parse 6 7urlurl = [] #rulurlというリストを作成 8 9for title_url in title_urls_list: 10 urlurl.extend.urllib.parse.urljoin("https://hogehoge.jp", title_url) 11 12print(urlurl)

こういったコードを書いてみましたが

AttributeError Traceback (most recent call last) <ipython-input-20-dda2295f857c> in <module>() 42 43 for title_url in title_urls_list: ---> 44 urlurl.extend.urllib.parse.urljoin("https://hogehoge.jp", title_url) 45 46 print(urlurl) AttributeError: 'builtin_function_or_method' object has no attribute 'urllib'

こういったエラーが出てしまいました。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

関数urllib.parse.urljoinは基底URLと別のURLを受取り組み合わせて絶対URLを作ります。その作られたURLは返り値となります。

python

1絶対URL = urllib.parse.urljoin(基底URL, 相対URL)

返り値は上に示したようにイコール記号を使い変数に代入することができます。

python

1print(urllib.parse.urljoin(基底URL, 相対URL))

また、上に示したように関数の引数にすることもできます。この場合、関数printurllib.parse.urljoin(基底URL, 相対URL)の返り値が引数として渡されます。結果として__絶対URL__が出力されます。

よって下のようにコーディングすれば期待された結果になります。

python

1# from文を使うことにより関数urllib.parse.urljoinをurljoinとして呼び出せる。 2from urllib.parse import urljoin 3 4base_url = "https://hogehoge.com" 5title_urls = [] # 相対URLが配列されていると仮定する。 6absolute_urls = [] # 絶対URLが配列されるリストを宣言しておく。absoluteは絶対という意味。 7 8for title_url in title_urls: 9 # 関数absolute_urls.appendはlist型のメソッド(その型特有の関数)であり、 10 # 引数として受け取った値を対象のリストに追加する。 11 absolute_urls.append(urljoin(base_url, title_url)) 12 13print(absolute_urls)

分かりやすさ優先のため少し厳密さには欠けるので**Pythonの公式ドキュメントを参照することを強くおすすめ**します。

投稿2021/08/03 18:28

0xVERS

総合スコア7

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

dd_

2021/08/03 18:46

ご回答ありがとうございます。勉強になりましたありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問