質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
C#

C#はマルチパラダイムプログラミング言語の1つで、命令形・宣言型・関数型・ジェネリック型・コンポーネント指向・オブジェクティブ指向のプログラミング開発すべてに対応しています。

Q&A

解決済

1回答

3143閲覧

C# HtmlAgilityPack.HtmlDocumentでの「System.OutOfMemoryException' の例外が mscorlib.dll で発生しました」について

GiveAHand

総合スコア286

C#

C#はマルチパラダイムプログラミング言語の1つで、命令形・宣言型・関数型・ジェネリック型・コンポーネント指向・オブジェクティブ指向のプログラミング開発すべてに対応しています。

1グッド

1クリップ

投稿2016/07/12 16:36

編集2016/07/12 17:16

C#で、WebBrowserを使った簡単なアプリケーションを作成しています。

あるサイトのリンク先のページを次々に表示させ、内容をCSVにダウンロードしていくというものですが、リンク先のデータが大量になると、メモリ不足でエラーになってしまいます。

具体的には、表示させたURLのhtmlを、

C#

1HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument(); 2doc.OptionAutoCloseOnEnd = false; 3doc.OptionCheckSyntax = false; 4doc.OptionFixNestedTags = true; 5doc.LoadHtml(webBrowser1.DocumentText);

このように読み込み、さらに読み込んだHTMLのテーブルの内容を、

C#

1HtmlAgilityPack.HtmlNodeCollection datas = 2 doc.DocumentNode.SelectNodes(@"//table/tbody/tr");

このように読み込み、

C#

1foreach (HtmlAgilityPack.HtmlNode datain datas) 2{ 3 4 HtmlAgilityPack.HtmlDocument tmp = new HtmlAgilityPack.HtmlDocument(); 5 tmp.LoadHtml(item.InnerHtml.ToString()); -6 7 HtmlAgilityPack.HtmlNodeCollection tds = tmp.DocumentNode.SelectNodes(@"//td"); 8 9 (ここで読み込んだデータをファイル出力する。) 10 11}

読み込んだデータをノードの数分、このようにループさせているのですが、だいたい8000行ぐらいループすると、「型 'System.OutOfMemoryException' の例外が mscorlib.dll で発生しましたが、ユーザー コード内ではハンドルされませんでした。」というエラーが出ます。

イメージ説明

一体このエラーは何なのでしょう?

このような状態なのですが、一体何をどうしたらいいのかという感じです。

一番怪しいのは、foreeachでループしている箇所ですが、何かいい改善策などはないものでしょうか?

mondaminZ👍を押しています

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

coco_bauer

2016/07/13 05:58

ループが実行されるたびに、tmp = new HtmlAgilityPack.HtmlDocument();で新しいオブジェクトが作らて、その分メモリの空きが減ります。ループ処理の終わりにtmpを解放して空きメモリを増やせば問題ありませんが、オブジェクトを作り続ければ、そのうち空きメモリが無い(OutOfMemory)になります。 tmpをはじめとするメモリの解放をしていないのが原因だと思われますが、コードが示されていないので推測の域を出ません。(そのため、回答では無くコメントに書きました)
guest

回答1

0

ベストアンサー

C#

1foreach (HtmlAgilityPack.HtmlNode datain datas) 2{ 3 ... 4 (ここで読み込んだデータをファイル出力する。) 5 tmp = null; 6 GC.Collect(); 7}

だといかがでしょうか?

投稿2016/07/17 04:48

hyper-drums-ko

総合スコア736

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

GiveAHand

2016/07/17 19:51

hyper-drums-ko様 ご提案ありがとうございます。 試してみて、変化は出ました。 今までエラーが出ていた箇所で、メモリ不十分のエラーが出なくなったので。 ただ、同じ関数内の別の場所でメモリ不足のエラーが出てしまい、また、診断ツールのプロセスメモリの値も、目で見る限り変わっていない(1G)ので、本当に効果があるのかどうかがわからないという感じです。。。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問