前提・実現したいこと(再度、訂正させて頂きました。)
初めまして
pythonのrequestsとseleniumとBeautifulSoupを使って
下記写真の右側矢印付近にあるix:nonnumericタグから左側の矢印に該当する氏名<塚田 耕司>を取得しようと試みたのですが、
何も要素を取得できませんでした。
ちゃんと要素を受け取るためにはどのようにcssセレクタを指定すればよろしいでしょうか?
こちらがターミナルの結果画像になります。
該当のソースコード
Python3.8
from bs4 import BeautifulSoup import requests from selenium import webdriver import time URL = "https://disclosure.edinet-fsa.go.jp/E01EW/BLMainController.jsp?uji.verb=W00Z1010initialize&uji.bean=ek.bean.EKW00Z1010Bean&PID=W1E63031&TID=W00Z1010&SESSIONKEY=1592144727926&stype=0&dcdSelect=35001&hcdSelect=&ycdSelect=&tsbSdt=&syoruiKanriNo=S100GG5L&keyword1=7203&keyword2=&keyword3=&keyword4=&keyword5=&lgKbn=2&pkbn=0&skbn=1&dskb=&askb=&dflg=0&iflg=0&preId=1&chr=7203&hbn=true&spf5=2&otd=35001&hcd=&sec=&scc=&shb=&snm=&spf1=1&spf2=1&iec=&icc=&inm=&spf3=1&fdc=&fnm=&spf4=1&cal=1&era=H&yer=&mon=&psr=1&pid=4&row=100&idx=0&str=&kbn=1&flg=" page = requests.get(URL) driver = webdriver.Chrome() driver.get(URL) time.sleep(3) soup = BeautifulSoup(driver.page_source, "html.parser") el = soup.select("div#diffBlock00_4") print(el) time.sleep(5)
試したこと
最初はrequestsでサイトを取得しBeatifulSoupで解析を行ったのですが、解析結果に
対応していないブラウザです
と表示されたのでseleniumでブラウザを起動し解析を試みました。
こちらのサイトを参考に様々なcssセレクタを試しましたが結果は同じでした。
https://gammasoft.jp/support/css-selector-for-python-web-scraping/
補足情報(FW/ツールのバージョンなど)
IDEはvisual stdio code
webブラウザーはChromeDriverでちゃんとバージョンが合ったものを使用しています。
当方は、htmlはprogateを一周、機械学習や作業の自動化に惹かれpythonを始めたばかりで拙い文章だとは思いますが、ご教授の方よろしくお願い致します。
回答2件
あなたの回答
tips
プレビュー