前提・実現したいこと
質問
PythonでWikipediaから、情報をスクレイピングするシステムを作っています。
情報を取り出すのは成功したのですが、タグが邪魔です。
どうすれば良いでしょうか?
実は二つプランがあって、
一つは、単純にタグを消去する方法。
もう一つは、タグの間の文字列を取り出し、
結合させる方法。(例)<p>○○○</p>
発生している問題・エラーメッセージ
タグのせいで、文が読みにくい。
(ほぼ読めない)
該当のソースコード
Python
1mport requests 2from bs4 import BeautifulSoup 3print('検索したい言葉を入力してください。') 4word = input('>> ') 5try: 6 response = requests.get( 7 'https://ja.wikipedia.org/wiki/' + word).status_code 8 if response == 200: 9 print('該当する結果が存在します') 10 result = requests.get('https://ja.wikipedia.org/wiki/' + word).text 11 soup = BeautifulSoup(result, 'html.parser') 12 p = soup.find('p') 13 print(p) 14 elif response == 404: 15 print('該当する結果は存在しません') 16 else: 17 print('エラーが発生しました') 18except: 19 print('インターネットに接続されていません') 20
試したこと
地道にreplaceコマンドで消去
補足情報(FW/ツールのバージョンなど)
ここにより詳細な情報を記載してください。
回答3件
あなたの回答
tips
プレビュー