Pythonの勉強をし始めたプログラミング初心者です。
Google Colabを使ってスクレイピングをテスト的にやってみているのですが、こちらのコードで結果に、「pタグ」が含まれたままなのですが、テキスト情報だけ抽出したい場合、どこを修正すればいいでしょうか。
よろしくお願いいたします。
import requests from bs4 import BeautifulSoup TARGET_URL = "https://www.giants.jp/G/player/" html = requests.get(TARGET_URL) soup = BeautifulSoup(html.content, "html.parser") elem = soup.find_all("td", class_="td_l") for a in elem: num = a.select("p.num") name = a.select("p.name") name2 = a.select("p.name2") print(num,name,name2)
現在の結果
[<p class="num">83</p>] [<p class="name">原 辰徳</p>] [<p class="name2">はら たつのり</p>] [<p class="num">88</p>] [<p class="name">金 杞泰</p>] [<p class="name2">きむ きいて</p>] [<p class="num">79</p>] [<p class="name">亀井 善行</p>] [<p class="name2">かめい よしゆき</p>] [<p class="num">82</p>] [<p class="name">實松 一成</p>] [<p class="name2">さねまつ かずなり</p>] [<p class="num">76</p>] [<p class="name">二岡 智宏</p>] [<p class="name2">におか ともひろ</p>]
あなたの回答
tips
プレビュー