C#で指定のURLのHTMLを取得して解析するプログラムを作成しています。
WebBrowserを使って、
C#
1//送信先アドレス 2string url = "http://xxxxxx.php"; 3 4//送信データ 5string str_post = "data=001"; 6 7//変換(バイト配列) 8byte[] byte_post = Encoding.ASCII.GetBytes(str_post); 9 10//ヘッダー情報 11string str_header = "Content-Type: application/x-www-form-urlencoded\r\n"; 12 13//表示 14this.Webbrowser1.Navigate(url, null, byte_post, str_header);
このように、あるPHPのサイトにPOSTした結果を、取得したいのですが、WebBrowser1のDocumentCompletedイベントで、HtmlAgilityPackを使って、
C#
1HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument(); 2doc.OptionAutoCloseOnEnd = false; 3doc.OptionCheckSyntax = false; 4doc.OptionFixNestedTags = true; 5doc.LoadHtml(Webbrowser1.DocumentText);
このようにページのHTMLを取得すると文字化けしてしまいます。
HtmlAgilityPackを使って、EUCのHTMLを文字化けせずに取得する方法は無いものでしょうか?
ちなみに、自分なりにいろいろ調べましたところ、
HTMLパーサ「Html Agility Pack」を使ってみた
http://hinatak.blogspot.jp/2011/02/htmlhtml-agility-pack.html
こちらのページに、HTMLページをEUCで取得して、HtmlAgilityPackに取得したHTMLを入れる方法がありますが、この方法だと、あくまでも、指定のURLのデータを取ってくる方法なので、Webbrowser1に表示させたHTMLをEUCで取得する方法が知りたいです。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2016/07/07 00:27