質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.35%

  • C#

    9666questions

    C#はマルチパラダイムプログラミング言語の1つで、命令形・宣言型・関数型・ジェネリック型・コンポーネント指向・オブジェクティブ指向のプログラミング開発すべてに対応しています。

C# WebBrowserのサイト読み込みを別スレッドにしたい

受付中

回答 1

投稿

  • 評価
  • クリップ 0
  • VIEW 1,922
退会済みユーザー

退会済みユーザー

C#のWinFormでWebBrowserオブジェクトでサイトを読み込んで、htmlを解析してlinkのURLをFormのListViewに表示させるフォームを作っています。

以下のようにサイトの読み込みが完了したらDocumentCompleted()が実行されるようになっています。

public partial class Form_main : Form {
    private WebBrowser wb = new WebBrowser();
    private ListView listView1 = new ListView();

    public main() {
        InitializeComponent();

        // サイト読み込みが完了したらwebBrowser_DocumentCompletedを実行する
        wb.DocumentCompleted += new WebBrowserDocumentCompletedEventHandler(webBrowser_DocumentCompleted);
    }

    // サイト読み込み完了後の処理
    private void webBrowser_DocumentCompleted(object sender, WebBrowserDocumentCompletedEventArgs e) {
        // HtmlAgilityPackを使ってhtmlをパース
        string html = in_wb.Document.Body.OuterHtml;
        HtmlAgilityPack.HtmlDocument hDoc = new HtmlAgilityPack.HtmlDocument();
        hDoc.LoadHtml(html);

        // aタグのhrefをlistView1にリスト化する
        foreach (HtmlAgilityPack.HtmlNode node in hDoc.DocumentNode.SelectNodes("//a/@href")) {
            string url = node.Attributes["href"].Value;
            ListView1.items.Add(url);
        }
    }
}
コード


しかしサイトが読み込み完了するまでListViewは更新されませんし、フォームのGUI自体が固まって操作ができません。
そこでWebBrowserでのサイト読み込み処理を別スレッドにして読み込む度にListViewにlinkのURLを追加していきたいのですが、どのような処理にすれば良いのでしょうか?

await/asyncまたはthreadクラスを使うようなのですがなかなか理解できる解説サイトが見つからずこちらで質問させて頂きました。

ちなみにWebBrowserのスレッドはバックグラウンドで行いたいです。
Formを閉じたらWebBrowserのスレッドが途中でも終了を待たずに閉じる、などが可能であればいいです。

お手数ですがどうぞよろしくお願い致します。

開発環境:
Windows10 64bit VisualStudio2015 .NetFramework4.0以上

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

+3

Windows Forms の WebBrowser は UI スレッドのみから操作可能なコントロールであるため他のスレッドから操作することはできません。スレッドを STAThread として作成することで UI スレッドとすることができますがオススメしません。

今回のように HTML を取得するのが目的であれば WebBrowser コントールを使用せずに C# で直接 HTML を読み込んだほうがシンプルに解決できると思うのですがどうでしょうか。

要件で .NET 4.0 とあったので async/await を使用できませんでしたが、.NET 4.5 以上であればこれらを使うことでかなり簡潔に書くことができます。

using HtmlAgilityPack;

public partial class Form_main : Form
{
    // ページの取得(バックグラウンド)
    protected void FetchDocumentAsync(string uri)
    {
        using (var wc = new WebClient())
        {
            wc.DownloadStringCompleted += (_, e) =>
            {
                if (e.Error != null)
                {
                    throw e.Error;
                }
                if (DocumentLoaded != null)
                {
                    var doc = new HtmlDocument();
                    doc.LoadHtml(e.Result);

                    // UI スレッドへのアクセス
                    Invoke(new Action(() => DocumentLoaded(this, new DocumentEventArgs(doc))));
                }
            };
            wc.DownloadStringAsync(uri);
        }
    }

    private IEnumerable<HtmlNode> CreateNodes(HtmlDocument doc, string xpath)
    {
        return doc.DocumentNode.SelectNodes(xpath);
    }

    public Form_main()
    {
        InitializeComponent();
        this.DocumentLoaded += LoadList;

        // 適当な場所で
        FetchDocumentAsync("https://www.google.com");
    }

    // 使用例
    public void LoadList(object sender, DocumentEventArgs e)
    {
        foreach (var uri in CreateNodes(e.Document, "//a/@href").Select(x => x.Attributes["href"].Value))
        {
            this.listView1.Items.Add(uri);
        }
    }

    public event EventHandler<DocumentEventArgs> DocumentLoaded;
}

public class DocumentEventArgs : EventArgs
{
    public HtmlDocument Document { get; private set; }

    public DocumentEventArgs(HtmlDocument doc)
    {
        this.Document = doc;
    }
}

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.35%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

同じタグがついた質問を見る

  • C#

    9666questions

    C#はマルチパラダイムプログラミング言語の1つで、命令形・宣言型・関数型・ジェネリック型・コンポーネント指向・オブジェクティブ指向のプログラミング開発すべてに対応しています。