実現したいこと
以下のプログラムを用いて、入力されているURL先のテキストを出力させたいです。(そして、できれば出力結果をテキストファイルに書き込みたい...)
ただ、以下のプログラムにあるURLだと形式エラーが出てしまい、困っています。
前提
個人的には、URLに「txt」があるから少し他のURLと違うのかな...とは思いつつそこから先へ進めずいます。
ちなみに、普通のWEBURLは大丈夫でした...
発生している問題・エラーメッセージ
Traceback (most recent call last): File "d:/selfpy/chap01/hello.py", line 7, in <module> text = soup.find(class_='entry-content').get_text() AttributeError: 'NoneType' object has no attribute 'get_text'
該当のソースコード
Python3
1from bs4 import BeautifulSoup 2import requests as req 3 4url = 'https://kokkai.ndl.go.jp/txt/121104376X01420230418/235' 5html = req.get(url).content 6soup = BeautifulSoup(html, 'html.parser') 7text = soup.find(class_='entry-content').get_text() 8print(text)
試したこと
- soup.findのクラス部分をtxtに変更した
- get.text➡get.txt に変更
補足情報(FW/ツールのバージョンなど)
些細な事、𠮟咤激励など含めてコメント等いただけると助かります。