Excelでselenium 文字列取得したい

前提・実現したいこと

Excel VBAでSeleniumを触り始めましたところです。
以下のHTMLより、「ccccc」の文字を取得したいです。

◼HTMLファイル

<table class="CL0"> <tbody> <tr class="CL1" id="ID1"> <td> <span><a href="URL">bbbbb</a></span> <img src="img.jpg" alt="alt1">   ccccc </td> </tr> </tbody> </table>

発生している問題・エラーメッセージ

InvalidSelectorError

該当のソースコード

Excel
1Sub macro()
2    Dim dr As New Selenium.WebDriver
3    dr.Start "chrome"
4    dr.Get "test.html"
5'    MsgBox dr.FindElementByXPath("/html/body/table/tbody/tr/td/text()").Text
6    MsgBox dr.FindElementByXPath("//*[@id='ID1']/td/text()").Text
7End Sub

試したこと

Chromeで、fullXpath、Xpathを取得したものを
FindElementByXPathに書いたのですが、
取得できませんでした。
text()が機能しないような印象です。

tdタグで取得する「bbbbb ccccc」から、
aタグの「bbbbb」の文字数を取得して、
ごまかしは効くのですが・・・。

補足情報（FW/ツールのバージョンなど）

Excel2020
Selenium v2.0.9.0

行動規範の内容に同意します

回答1件

ベストアンサー

SeleniumからChromeを操作しようとしてるようだけれども
SeleniumとChromeDriverは最新が入っているよね？
あと[selenium Type Library]の参照設定されている状態だとして
Chrome操作で立ち上げてURL移動はこんな感じ

VBA
1Dim objDriver       As WebDriver
2Set objDriver = New ChromeDriver
3
4Call objDriver.Start
5objDriver.Timeouts.PageLoad = 30000
6Call objDriver.Get("test.html", 30000, False)
7

要素を探す

FindElementByXPathで試したんですがどうしてもうまくいかない...
//*[@id='ID1']/td/text()
だとCCCの前にimgタグがあったりして合わせられませんでした
Seleniumの検索JSと違った動きするので検索しずらかったりします。
そこで別の手段

ブラウザ上でJavaScriptを動かし結果を取得する

VBA
1Dim objDriver       As WebDriver
2Dim strJS           As String
3Dim strRet          As String
4
5Set objDriver = New ChromeDriver
6Call objDriver.Start
7objDriver.Timeouts.PageLoad = 30000
8Call objDriver.Get("test.html", 30000, False)
9
10strJS = ""
11strJS = strJS & "try{"
12strJS = strJS & "  return document.getElementById('ID1').getElementsByTagName('TD')[0].getElementsByTagName('img')[0].nextSibling.data;"
13strJS = strJS & "}catch(e){"
14strJS = strJS & "  return 'Error:' + e.message;"
15strJS = strJS & "}"
16strRet = objDriver.ExecuteScript(strJS)
17If strRet like "Error:*" Then
18    'エラー処理
19Else
20    '正規の処理
21    Debug.Print strRet
22End If

Seleniumだとできない検索方法が使えたり
処理も行えるからどうしてもこっちメインになるんだよね

投稿2020/09/18 09:26

kuma_kuma_

総合スコア2506

slavePG

2020/09/21 09:16

ありがとうございます。現状ではJavaScriptを導入するほど頭に余裕が無いので、「JavaScript使えば対処できる！」と記憶の片隅に留めてておくことにしたいと思います。折角回答頂いたのに、すぐに活用できなくてすみません。

kuma_kuma_

2020/09/21 10:37

いいえいいですよただ今回のCCCの場合やはりXPathでの指定は難しいですねどうしてもBBB CCCとなってしまします。ブラウザのXPathのコピーでもうまくいきませんでした JavaScriptはブラウザのデバッグ画面のコンソールから順番に指定していってどうやったら取得できるかためされるのが一番わかりやすいと思います。 Seleniumの場合表のこことここを取得したいとかができないので大変かと思いますが頑張ってください

行動規範の内容に同意します