質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
C#

C#はマルチパラダイムプログラミング言語の1つで、命令形・宣言型・関数型・ジェネリック型・コンポーネント指向・オブジェクティブ指向のプログラミング開発すべてに対応しています。

Visual Studio

Microsoft Visual StudioはMicrosoftによる統合開発環境(IDE)です。多種多様なプログラミング言語に対応しています。

タグ

特殊な記法により文書に埋め込む形で記述される付加情報をタグと呼びます。文書構造や書式、文字飾りなどを指示したり、画像や他の文書へのリンクを埋め込むことができる。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

Q&A

解決済

2回答

12282閲覧

C# HTMLタグを除去したい

C-shosinka

総合スコア32

C#

C#はマルチパラダイムプログラミング言語の1つで、命令形・宣言型・関数型・ジェネリック型・コンポーネント指向・オブジェクティブ指向のプログラミング開発すべてに対応しています。

Visual Studio

Microsoft Visual StudioはMicrosoftによる統合開発環境(IDE)です。多種多様なプログラミング言語に対応しています。

タグ

特殊な記法により文書に埋め込む形で記述される付加情報をタグと呼びます。文書構造や書式、文字飾りなどを指示したり、画像や他の文書へのリンクを埋め込むことができる。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

0グッド

1クリップ

投稿2017/08/10 08:48

##実現したいこと
HTMLタグ(<!---->の中身/</a></span></b>)などの除去の仕方がわかりません。どう処理したらいいのでしょうか。取得はHTML AgilityPackで行っています。よろしくお願いします。
(取得したいサイト→http://guardianlife.sakura.ne.jp/info.html)←(HTMLタグ盛りだくさん)
※データ利用など、このサイトの管理者に許可を頂いています
###補足情報(言語/FW/ツール等のバージョンなど)
C#・.NET4.6 HTMLAgilityPack・VisualStudio2017

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

正規表現置換するとか

C#

1var text = Regex.Replace(html, "<[^>]*?>", "");

投稿2017/08/10 09:26

x_x

総合スコア13749

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

C-shosinka

2017/08/10 10:47

ありがとうございます!
guest

0

昔書いたコード。

/// <summary> /// HTMLのタグを全部削除。また文字参照(&lt;など)も置換します /// </summary> /// <param name="html"></param> /// <returns></returns> public static string HtmlTagAllDelete(string html) { bool tagStart = false; System.Text.StringBuilder strBuilder = new System.Text.StringBuilder(); foreach (char c in html.ToCharArray()) { if (tagStart == true) { if (c.Equals('>')) { tagStart = false; //tagの終了時にはスペースを加える strBuilder.Append(' '); } } else { if (c.Equals('<')) { tagStart = true; } else { strBuilder.Append(c); } } } strBuilder.Replace("&nbsp;", " "); strBuilder.Replace("&lt;", "<"); strBuilder.Replace("&gt;", ">"); strBuilder.Replace("&amp;", "&"); strBuilder.Replace("&#038;", "&"); strBuilder.Replace("&quot;", "\""); return strBuilder.ToString(); }

投稿2017/08/10 09:16

kiichi54321

総合スコア1984

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

C-shosinka

2017/08/10 10:47

ありがとうございます!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問