PHPのpreg_match_allでwebスクレイピングを試みていて、
正規表現の書き方を思いつかなかったため質問いたします。
以下のようなHTMLに対して、
日付と日付の間のコンテンツを抽出し、
その抽出した情報を、日付と関連付けさせることは可能でしょうか。
見出しを抽出するだけであれば、<h2>([0-9]+月[0-9]+日)</h2>で事足りることはわかるのですが、
間のコンテンツを拾う方法を思いつきませんでした。
宜しくお願い致します。
質問の意図が不明瞭ということであれば御指摘ください。
具体的にどういった結果を期待しているのでしょうか?配列で受け日付をキーにしたjsonデータとか?