質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.51%

  • VBA

    2305questions

    VBAはオブジェクト指向プログラミング言語のひとつで、マクロを作成によりExcelなどのOffice業務を自動化することができます。

Excel VBAでのWebスクレイピングについての質問です。

解決済

回答 3

投稿 編集

  • 評価
  • クリップ 1
  • VIEW 2,991

TomoyaOkada

score 4

https://www.equitation-japan.com/index.php?menuindex=101-102

2時間に一回、上記のURLから会員番号と会員氏名を自動で抽出してExcelで一覧表を作りたいと考えています。
テキストファイルにWEBサイトのHTMLを出力することはできたのですが、会員名などが出てきません。
どのようにしたら良いか教えて下さい。
よろしくお願い致します。

Public Sub printMain()

Public Sub printMain()

Dim ie As InternetExplorer
Dim FCK As Object
Dim TSO As Object
Dim TGT As String
Set FCK = CreateObject("scripting.FileSystemObject")
TGT = ThisWorkbook.Path & "\HTML_FILE.txt"
Set ie = CreateObject("InternetExplorer.Application")
ie.Visible = True
ie.navigate "https://www.equitation-japan.com/index.php?menuindex=101-101"
Do While ie.Busy Or ie.readyState < READYSTATE_COMPLETE
    DoEvents
Loop

    Set form = ie.document.form.sub1
    form.Click

Dim HTMLString As String
Dim htdoc As HTMLDocument
Set htdoc = ie.document
    
Dim ret As String
ret = htdoc.getElementsByTagName("HTML")(0).outerHTML & vbCrLf

    Set TSO = FCK.OpenTextFile(TGT, 2, True)
    
    With TSO
        .WriteLine (ret)
        .Close  'ファイルのクローズ
    End With


End Sub
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 3

checkベストアンサー

+1

会員一覧ボタンを押しても現在のところスクリプトエラーでそれらしい情報は表示されません。
もしその情報をきちんと取られているなら、そのHTMLより正規表現などを使って抽出されれば良いかと思います。(テキストファイルにHTMLを出力する必要は無いです)
でも、他の方も書かれていますが、初めからEXCELでデータが取れるなら、何のために必要なのでしょうか?

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2015/03/09 21:02

    回答して頂きありがとうございます。
    数時間ごとに表の内容が変わることがあるので、定期的にエクセルのデータを取りに行かなければなりません。
    ですので、自動で定期的にデータを取りに行けるようにしたいと考えています。

    何か良い方法があれば教えて頂けると助かります。

    キャンセル

  • 2015/03/10 10:23

    なるほど。他の方への回答で表示できない理由が判りました。
    まずURLを直接たたいてもダメです。
    これは検索パラメーターをgetではなくpostでわたしているからです。
    なのでXMLHTTPを使って、postしてあげて戻りのHTMLから正規表現で必要な内容を抽出すれば良いでしょう。
    同様にExcelの方のデータも可能だと思います。
    定期的に自動的で実行するにはスケジューラーを使えば良いでしょう。タイマーを使い順で実装するより楽だと思います。
    ここはエンジニアのサイトと言うことなので、実際の実行コードの開示は適切ではないと思いますのでヒントまでにしておきます。
    とりあえずXMLHTTPをググってみてください。postの意味が判らなければ、かなり基本的な知識が不足しているのでゴールまではかなりあります。
    頑張ってください。

    キャンセル

+1

単純に、掲載の
https://www.equitation-japan.com/index.php?menuindex=101-102
では、な~~~~にも情報がでません。
なのは、判っていますよね?
情報を取得したいのであれば、
正規に、ログインした後に、
規定手段にて、サイトアクセスする必要があります。
博打系の方は、「楽してプログラムを作ってもらう方法」の様な事を読んでいらっしゃるようですが、
技術系掲示板では、迷惑なだけです。
質問の方法を考えるか、もっと真面な質問に変える必要があります。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2015/03/09 22:26

    質問の仕方が悪くてすみません。

    (トップページ) https://www.equitation-japan.com/
       ↓
    会員・乗馬情報
       ↓
      会員情報
       ↓
    テキストボックスなどには何も入力せずに検索

    上記の手順で、https://www.equitation-japan.com/index.php?menuindex=101-102
    のサイトにアクセスしています。


    FirefoxのLive HTTP Headers というアドオンを使い、HTTPヘッダーを見てみると会員氏名などが出てくるので、HTTPヘッダーを取得できるようなプログラムを作れれば良いです。

    ※HTTPヘッダーの中身で、一行の文字数が多くてLive HTTP Headersで見ようとすると文字化けしている部分がます。
    なので、テキストファイルに一度すべてを保存してから、メモ帳で見ています。

    何か参考になるサイトでも教えて頂けると助かります。

    キャンセル

0

検索後、右上に表示される薄緑の「会員一覧」のボタンからエクセル出力ができるようです。
生成はすこぶる遅いようですが、これでは駄目なのでしょうか。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

同じタグがついた質問を見る

  • VBA

    2305questions

    VBAはオブジェクト指向プログラミング言語のひとつで、マクロを作成によりExcelなどのOffice業務を自動化することができます。