質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Beautiful Soup

Beautiful Soupは、Pythonのライブラリの一つ。スクレイピングに特化しています。HTMLデータの構文の解析を行うために、HTMLタグ/CSSのセレクタで抽出する部分を指定することが可能です。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

Q&A

解決済

2回答

1097閲覧

ログイン機能付きサイトにおけるseleniumでの自動操作について

i-garasi

総合スコア12

Beautiful Soup

Beautiful Soupは、Pythonのライブラリの一つ。スクレイピングに特化しています。HTMLデータの構文の解析を行うために、HTMLタグ/CSSのセレクタで抽出する部分を指定することが可能です。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

1グッド

2クリップ

投稿2018/11/28 03:00

前提・実現したいこと

現在職場で利用しているグループウェア「GroupSession」へpythonで自動ログインを行い、
ログイン後のトップページで「業務開始」ボタンを押下するというプログラムを作ろうとしています。

◆環境、使用モジュール
windows10
python 3.7.1
selenium 3.141.0
chrome 70.0.3538.110
chromedriver 2.44

発生している問題・エラーメッセージ

自動ログインの部分までは成功したのですが、ログイン後に表示されたトップページにおいて
目的の業務開始ボタンをクリックすることが出来ていない状況です。
以下が実際のコードとなります。

Python

1import json 2from bs4 import BeautifulSoup 3from time import sleep 4from selenium import webdriver 5from selenium.webdriver.chrome.options import Options 6from selenium.webdriver.common.keys import Keys 7 8config_file = open('config.json' , 'r' , encoding="utf-8_sig") 9config = json.load(config_file) 10 11URL = config["GS_LOGIN_URL"] 12ID = config["GS_LOGIN_ID"] 13PASS = config["GS_LOGIN_PASS"] 14 15options = Options() 16options.set_headless(True) 17driver = webdriver.Chrome(chrome_options=options) 18driver.get(URL) 19sleep(3) 20 21driver.find_element_by_name("cmn001Userid").send_keys(ID) 22driver.find_element_by_name("cmn001Userid").send_keys(Keys.TAB) 23driver.find_element_by_name("cmn001Passwd").send_keys(PASS) 24driver.find_element_by_name("cmn001Passwd").send_keys(Keys.ENTER) 25sleep(5) 26 27driver.execute_script("window.scrollTo(0, document.body.scrollHeight);") 28driver.find_element_by_css_selector("#timecard_tcdmain > form > table > tbody > tr:nth-child(2) > td.td_type1 > table > tbody > tr:nth-child(1) > td > input").click 29

実行すると最終行のコードにてそんなエレメントは存在しないという内容の
エラーが返されてきます。
(css selectorはchromeのデベロッパーツールからcopy selectorにて取得したものです。)

ログイン後のページを確認するためにBeautifulSoupをインポートし
printしてみたところ、ログイン後のページのhtmlではあるのですが
下記のようなアローが全て閉じられた骨組みの部分だけのhtmlが取得されてきてしまいます。

HTML

1<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> 2<html xmlns="http://www.w3.org/1999/xhtml"><head> 3<title>[GroupSession]</title> 4<link href="../common/images/favicon.ico" rel="SHORTCUT ICON"/> 5<meta content="text/html; charset=utf-8" http-equiv="Content-Type"/> 6<link href="../common/css/theme1/theme.css?480" rel="stylesheet" type="text/css"/> 7<link href="../common/css/default.css?480" rel="stylesheet" type="text/css"/> 8</head> 9<frameset cols="1" frameborder="no" rows="90,*"> 10<frame name="menu" noresize="true" scrolling="no" src="../common/cmn003.do?menuPage=1"/> 11<frame name="body" scrolling="yes" src="../main/man001.do"/> 12</frameset> 13<noframes> 14Group Sessionはフレーム対応のブラウザでなければご利用いただけません。 15</noframes> 16</html>

質問したいこと

上記を踏まえて以下の二点について質問させて頂きたいです。

◆htmlが正しく取得できていないのはなぜでしょうか
◆htmlがうまく取得できていないことが原因で業務開始ボタンを探し出すことが出来ていないのか、
そもそもcssselectorの設定が誤っているのか

isonov👍を押しています

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

yoorwm

2018/11/28 03:26

これは、出社しないでタイムカードを押そうとしているのでしょうか?
i-garasi

2018/11/28 03:57

打刻漏れを防ぐため出社後の端末起動時に実行されるようbatファイルに記述しスタートアップに置いて使うつもりです。
guest

回答2

0

自己解決

以下のコードを追加することで解決しましたのでご報告します。
frame内のDOM要素はそのままでは操作することができないようで、
操作対象の要素が格納されたframeを選択し、その上で実行する必要があったようです。

Python

1iframe = driver.find_element_by_name("body") 2driver.switch_to_frame(iframe) 3driver.find_element_by_css_selector("#timecard_tcdmain > form > table > tbody > tr:nth-child(2) > td.td_type1 > table > tbody > tr:nth-child(1) > td > input").click()

フロントエンドの知識に疎く、返されてきたHTMLだけではぱっと見て判断することができませんでした。

投稿2018/12/03 07:09

i-garasi

総合スコア12

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

0

おそらくクローラー対策をされているかもしれません
ChromeDriverにUserAgentを与えてみましょう。これで、無理ならあきらめましょう

投稿2018/11/28 03:03

yamato_user

総合スコア2321

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

i-garasi

2018/11/28 03:23

ご回答ありがとうございます。 useragentの設定ですね、早速試してみようと思います。
i-garasi

2018/11/28 04:36

UAを設定のもと再度実行しましたが結果は変わらずでした…。 打刻の自動化については諦めようと思います。 この度はご回答のほどありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問