PHPで、
<h1>2015.12.9</h1><h2>サンプルページを更新しました。</h2>から h1の値:2015.12.9を取得したり h2の値:サンプルページを更新しました。を取得したりしたいのですが どうすれば取得することができますか。 よろしくお願いします。気になる質問をクリップする
クリップした質問は、後からいつでもMYページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
回答3件
0
別ファイルとして存在するHTMLを読み取って、そのHTML文の中からHeadingタグ (h1-h6) をピックアップしたい。
という要望だろうと思って書きました。動作確認はしていません。
「別ファイルのhtml」が外部サイトなら、$html_fileをURIにしてください。
// $html_file = 'https://ex.amp.le/index.html';
PHP
1$html_file = './foo.html'; 2$raw_html = ''; 3$pattern = '/<(h[1-6])>(.*)<\/h[1-6]>/'; 4$result = []; 5 6try{ $raw_html = file_get_contents($html_file); } 7catch(Exception $e){ var_dump($e->getMessage()); } 8 9if(preg_match_all($pattern, $raw_html, $matches, PREG_SET_ORDER) === false){ 10 exit(); // or 'return false', 'throw new Exception(...)', ... 11} 12 13foreach($matches as $match){ 14 $result[] = [ 'tag': $match[1], 'value': $match[2] ]; 15} 16 17print_r($result); 18 19/* 20 21Array 22( 23 ( 24 [tag] => h1 25 [value] => 2015.12.9 26 ) 27 ( 28 [tag] => h2 29 [value] => サンプルページを更新しました。 30 ) 31) 32 33*/ 34
投稿2016/01/20 14:39
総合スコア2982
0
ベストアンサー
こんにちは。
方法は色々とあるかと思いますが
勘違いが無ければ思いつきました下記2つの方法が考えられるかと思います。
方法1: 正規表現を用いる
あらかじめ決まっているような場合は正規表現を用いることが出来るかと思われます。
- <h1>部分を取り出す。
php
1preg_match('/<h1>(.+?)<\/h1>/', '<h1>2015.12.9</h1><h2>サンプルページを更新しました。</h2>', $matches); 2print_r($matches);
Array ( [0] => <h1>2015.12.9</h1> [1] => 2015.12.9 )
- <h2>部分を取り出す。
php
1preg_match('/<h2>(.+?)<\/h2>/', '<h1>2015.12.9</h1><h2>サンプルページを更新しました。</h2>', $matches); 2print_r($matches);
Array ( [0] => <h2>サンプルページを更新しました。</h2> [1] => サンプルページを更新しました。 )
方法2: HTMLをパースする
PHPで扱いやすく連想配列にしてしまうなど
こちらのサイトなどを参考に( https://blog.katty.in/1400 )次のようにする方法もあるかと思われます。
※文字コードはUTF-8前提。
php
1$dom = new DOMDocument(); 2$dom->loadHTML(mb_convert_encoding('<h1>2015.12.9</h1><h2>サンプルページを更新しました。</h2>', 'HTML-ENTITIES', 'UTF-8')); 3$xml = $dom->saveXML(); 4$res = json_decode(json_encode(simplexml_load_string($xml)), true); 5 6echo $res['body']['h1'], "\n"; 7echo $res['body']['h2'], "\n";
2015.12.9 サンプルページを更新しました。
ご参考までに。
投稿2016/01/20 07:05
退会済みユーザー
総合スコア0
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
0
こんにちは。
HTMLのパーサを作っているわけではないですよね・・・
ブラウザから、PHPが動くサーバにデータ送信するという意味だと考えて回答いたしますと、
h1やh2のデータは自然には送信されません。
サーバにデータを送信する基本は以下のHTMLです。
HTML
1<form action="hoge.php" method="POST"> 2 <input type='hidden' name='hdn' value='hdnValue'> 3 <input type='text' name='txt' value='txtValue'> 4 <select name='slct'> 5 <option value='slctValue1'>NO1</option> 6 <option value='slctValue2'>NO2</option> 7 </select> 8 <input type='submit' value='soushin' name='soushin' > 9</form>
・formタグで囲われている部分が送信対象で、action属性にかかれたURLへデータ送信する。
・input タグ、selectタグ、textareaタグなど、データ送信するHTML要素は決められている
・name属性がキー、value属性が値として送信される
です。
そのため、h1やh2の内容はサーバには送信されません。
当然、サーバサイドで動くPHPは、その内容を読み取ることはできません。
投稿2016/01/20 06:31
編集2016/01/20 06:32総合スコア422
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
あなたの回答
tips
太字
斜体
打ち消し線
見出し
引用テキストの挿入
コードの挿入
リンクの挿入
リストの挿入
番号リストの挿入
表の挿入
水平線の挿入
プレビュー
質問の解決につながる回答をしましょう。 サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。 また、読む側のことを考えた、分かりやすい文章を心がけましょう。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。