正規表現のパターンを作成するときに、HTMLタグの中の属性を除いて、パターンを作成したいです。
例えば、
<html itemscope="" itemtype="http://schema.org/WebPage" lang="ko-JP">の場合であると、 htmlだけを取得したいです。正規表現でどうあらわすかが分かりません。
//省略
String s = getSourceText(new URL("https://www.google.co.jp/")); // 正規表現のタグのパターンを作成する。 Pattern p1 = Pattern.compile
("//この部分にHTMLタグの中の属性を除いて正規表現を作りたい");
// URLのテキスト文がタグの部分と一致させる。 Matcher m1 = p1.matcher(s);
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。