初めてPythonを練習してます。
「ファイル名」と「ファイルパス」の組み合わせで辞書を作ろうとしております。
ファイル名の方はaタグで囲まれたテキストから取れたのですが、
ファイルパスを、hrefのパスを取ろうとしたら下のエラーになりました。
error
1None 2Traceback (most recent call last): 3 File "C:\kaigi_pdf_dl\kaigi_pdf_DL.py", line 36, in <module> 4 path = list.get("href") 5 File "E:\programs\Python\Python310\lib\site-packages\bs4\element.py", line 963, in __getattr__ 6 raise AttributeError( 7AttributeError: 'NavigableString' object has no attribute 'get' 8
エラーでググってもヒントに行き着きませんでした。
分かる方教えていただけると幸いです。
宜しくお願い致します。
Python
1import requests 2from bs4 import BeautifulSoup 3 4url = "https://www.town.tobetsu.hokkaido.jp/site/gikai/18717.html" 5response = requests.get(url) 6response.encoding = response.apparent_encoding 7 8 9soup = BeautifulSoup(response.text, "html.parser") 10lists = soup.find("div","detail_free") 11links = lists.find_all("a") 12urls=[] 13for href in links: 14 buf = "https://www.town.tobetsu.hokkaido.jp" + href.get("href") 15 #print(buf) 16 urls.append(buf) 17 18 19 20for u in urls: 21 response = requests.get(u) 22 response.encoding = response.apparent_encoding 23 24 25 soup = BeautifulSoup(response.text, "html.parser") 26 lists = soup.find("div","detail_free") 27 #print(lists) 28 links = lists.find_all("a") 29 #print(links) 30 31 # ファイル名とパスの辞書を作成 32 for list in lists: 33 # 改行有無混在してるので改行なしに統一 34 name = list.text.replace('\n', '') 35 #print(name) 36 path = list.get("href") ##ここでエラー 37 print(path) 38
提示コードをそのまま実行してみましたが以下のような異なるエラーが発生します。
AttributeError: 'NavigableString' object has no attribute 'text'
いまいちど提示コードおよびエラー内容が正しいか確認ください。
あれ?何ででしょう?
掲載したコードをローカルとDIFFしましたが同じでした。
こちらでは掲載したエラーコードです。
name = list.text.replace('\n', '')
の行をコメントアウトしたら出なくなるかもです。
掲載したコードをローカルに落として新規にhoge.pyとして実行しましたがやはり同じエラーになりました。
「for list in lists:」の次の行に「print([list])」を入れて実行してみてください。
以下は当方環境での実行結果です。
[<ul>
<li><a href="/uploaded/attachment/18770.pdf">令和3年第1回定例会(3月) [PDFファイル/1.47MB]</a></li>
<li><a href="/uploaded/attachment/18892.pdf">令和3年第1回臨時会(5月) [PDFファイル/251KB] </a> </li>
<li><a href="/uploaded/attachment/19144.pdf">令和3年第2回定例会(6月) [PDFファイル/950KB]</a></li>
<li><a href="/uploaded/attachment/19359.pdf">令和3年第2回臨時会(8月) [PDFファイル/262KB]</a></li>
</ul>]
None
['\n']
となり、その後「~ nottribute 'text'」となります。
上記のNoneはprint(path)の結果でしょうか。
その次が「['\n']」となっているのが、おそらく質問者様での実行結果と異なるのではないかと思われます。
「for list in lists:」の次の行に「print([list])」を入れて実行すると以下のようになりました。
[<ul>
<li><a href="/uploaded/attachment/18770.pdf">令和3年第1回定例会(3月) [PDFファイル/1.47MB]</a></li>
<li><a href="/uploaded/attachment/18892.pdf">令和3年第1回臨時会(5月) [PDFファイル/251KB] </a> </li>
<li><a href="/uploaded/attachment/19144.pdf">令和3年第2回定例会(6月) [PDFファイル/950KB]</a></li>
<li><a href="/uploaded/attachment/19359.pdf">令和3年第2回臨時会(8月) [PDFファイル/262KB]</a></li>
</ul>]
None
['\n']
Traceback (most recent call last):
File "C:\kaigi_pdf_dl\kaigi_pdf_DL.py", line 37, in <module>
path = list.get("href")
File "E:\programs\Python\Python310\lib\site-packages\bs4\element.py", line 963, in __getattr__
raise AttributeError(
AttributeError: 'NavigableString' object has no attribute 'get'
>上記のNoneはprint(path)の結果でしょうか。
print(path)をコメントアウトすると、Noneが消えました。
なるほど。
Noneに対してgetを使おうしていたということなんでしょうか?
回答1件
あなたの回答
tips
プレビュー