質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

VBA

VBAはオブジェクト指向プログラミング言語のひとつで、マクロを作成によりExcelなどのOffice業務を自動化することができます。

Q&A

解決済

3回答

3429閲覧

特定div下の<a>タグ要素を取得したい。。。

Hoshito823

総合スコア10

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

VBA

VBAはオブジェクト指向プログラミング言語のひとつで、マクロを作成によりExcelなどのOffice業務を自動化することができます。

0グッド

0クリップ

投稿2018/08/11 15:14

編集2018/08/15 03:02

前提・実現したいこと

VBAで簡単なwebスクレイピングの練習をしております。

className="top"の下の子要素である<h4>タグで囲まれている、
<a>タグ要素の取得方法が分からず質問させていただきました。

初歩的な質問で申し訳ありませんが調べても理解できなかったため質問させていただきました。
よろしくお願いいたします。

取得したい要素の構造

<div class="top">   <h4><a href="https://www1.............>contents1</a></h4> </div> <div class="top">   <h4><a href="https://www2.............>contents2</a></h4> </div> <div class="top">   <h4><a href="https://www3.............>contents3</a></h4> </div>

このような構造において全<a>タグのURLと要素内容を取得したいです。

書きかけのコード

vba

1 2 ```ここに言語を入力 3 Dim htmlDoc As HTMLDocument 4 Set htmlDoc = targetIE.document 5 6 Dim colTop As IHTMLElementCollection 7 Set colTop = htmlDoc.getElementsByClassName("top") 8 9 Dim topElement As IHTMLElement 10 Dim tagA As IHTMLElement 11 12 For Each topElement In colTop 13 tagA = topElement.Children.getElementsByTagName("a") 14 debug.Print tagA.innerText 15 debug.Print tagA.href 16 Next topElement

エラー箇所

For文内
tagA = topElement.Children.getElementsByTagName("a")
で ”実行時エラー'438': オブジェクトは、このプロパティまたはメソッドをサポートしていません”
と表示されます」。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

m.ts10806

2018/08/12 00:00

コードブロック```内はコードまたはエラーメッセージのみにしてください。正しく再現確認がとれません。また、colTop は想定通りの情報がとれていますか?For文内には幾つか記述がありますが、どこでそのエラーは出ているのでしょうか?
Hoshito823

2018/08/12 10:55

ご指摘いただきありがとうございました。以後ご質問させていただくときには気を付けるようにいたします。For文内のtagA = topElement.Children.getElementsByTagName("a") の箇所でエラーが発生します。。。colTopは期待通りのHTMLCollectionが取得できております。
m.ts10806

2018/08/12 11:02

質問は編集できるので適宜対応してもらえると助かります
guest

回答3

0

ベストアンサー

以下の3点が問題ですね。

  1. tagA取得時にSetをしていない
  2. topElementChildrenの参照は不要
  3. tagAの型が異なる

ということでFor Each文を書き直すと以下のような感じでしょうか?

vba

1 Dim topElement As IHTMLElement 2 For Each topElement In colTop 3 Dim tagA As MSHTML.IHTMLElementCollection 4 Set tagA = topElement.getElementsByTagName("a") 5 'tagA.item(0) はtagA(0)でも可 6 Debug.Print tagA.item(0).innerText 7 Debug.Print tagA.item(0).href 8 Next topElement

180812 2038 見当外れなことを書いていたので修正

ChildrengetElementsByTagNameは定義されていないのでそこでエラー
hatena19さんの回答でそこを修正しても「1. tagA取得時にSetをしていない」のためエラー
ということだと思われます

投稿2018/08/12 11:34

編集2018/08/12 11:38
imihito

総合スコア2166

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

VB - IE操作におけるVBAでのChildren使用時のオブジェクト変数が設定されていないエラーの対処法(83903)|teratail

上記と同じミスだと思います。

Children も getElementsByTagName も複数の要素(要素のコレクション)を返します。

子要素の最初の要素の最初のaタグを取得したいなら、下記のように添え字をつけて参照します。

vba

1tagA = topElement.Children(0).getElementsByTagName("a")(0)

投稿2018/08/12 02:52

hatena19

総合スコア33620

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Hoshito823

2018/08/12 10:48

お教えいただきありがとうございました。 添え字をつけて参照しても tagA = topElement.Children(0).getElementsByTagName("a")(0) の箇所で”オブジェクト変数またはWithブロック変数が定義されていません” と表示されてしまいます。
guest

0

候補となる <a>タグ要素を親エレメントで判定して抽出できないでしょうか。

Dim aElem As MSHTML.HTMLAnchorElement

If aElem.parentElement.outerHTML Like "<h4><a*" Then
Debug.Print aElem.innerText
End If

投稿2018/08/12 00:27

TanakaHiroaki

総合スコア1063

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Hoshito823

2018/08/12 10:46 編集

ご教授いただきありがとうございました。 先ほどのFor文の中に判定条件を入れてみたのですがやはり If aElem.parentElement.outerHTML Like "<h4><a*" Then のところで”オブジェクト変数またはWithブロック変数が定義されていません”とエラーが出てしまいます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問