前提・実現したいこと
初心者です。
社内システムにアクセスしてスクレイピングをしたいです。
IT管理者からDBに直接SQLを投げることは禁じられ、
代わりにpython with Seleniumを使うことを命じられました。
pythonはある程度経験があるのですが、
htmlやJS、Seleniumに関しては全くの無知です。
社内のページなので詳しいソース等は載せられません。
手順
⑴
ページAのURLを直接指定し開きます。
python
1driver.get("ページA")
⑵
ページA内にあるボタンをクリックすると、
新しいタブでページBが開きます。
ページBは直接指定して開くことができません。
python
1btn = driver.find_element_by_id("ページA内のボタン") 2btn.click()
⑶
ページBにhandleを切り替えます。
python
1allHandles = driver.window_handles 2driver.switch_to_window(allHandles[1])
⑷
ページBはログイン画面で、IDPWを入力すると、
そのままメインメニューに移行します。
python
1id = driver.find_element_by_id("IDテキストボックスの要素") 2id.send_keys("ID") 3password = driver.find_element_by_id("PWテキストボックスの要素") 4password.send_keys("PW") 5login_button = driver.find_element_by_name("ログインボタンの要素") 6login_button.click()
⑸
移行後のページB内にあるボタンをクリックすると、
新しいタブでページCが開きます。
ページCも直接指定して開くことはできません。
ページCはデフォルトで上部にプルダウンが一つあるだけで、
それ以外には何も表示されていません。
テキストボックスやボタン等もないです。
手動操作時はプルダウンから値を選択すると、
自動でページCの下部に目的のデータが表示されます。
SeleniumでページCを表示させるところまでは成功したのですが、
ページCにhandleを変更するために
以下を実行するとインデックスエラーとなりました。
python
1allHandles = driver.window_handles 2driver.switch_to_window(allHandles[2])
試したこと
ページCを開いた後、printでhandleを全て表示させてみたら
A,B,Cと見かけ上は3つタブが開いているのに
2つしかhandleがありませんでした。
また、ページCを開いた後、そのままdriver.getで適当な
サイトへのアクセスを試みると、ページBがそのサイトに変化しました。
よく見てみると
ログイン後ページBのURLは
html
1http://192.168.1.8/hogehoge/ 2```ページCのURLは 3```html 4http://192.168.1.8/hogehoge/?mode=month
と非常に似ています。
ページC、ログイン前ページB、ログイン後ページB で
それぞれctrl+Uキーを押すと同じソースコードが表示されます。
それぞれF12キーを押すと異なるソースコードが表示されます。
###ご質問事項
ソースコードを見ていると、「Ajax」や「〜.js」などの文字があったので、
十中八九JSを用いてページCは作成されていると思うのですが、
いかんせんJSはほぼ触れたことがないので、
分析の仕方もよくわかっておりません。
なんとかしてページCの要素を取得したいのですが、
こういうことを調べてみるといいというような
役立つ情報をご教授いただけないでしょうか。
また、今回どのような事態が起こっているため
ページCにhandleが割当てられなかったかを
推測していただけないでしょうか。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。