質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.52%

  • PHP

    20298questions

    PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

  • JavaScript

    16362questions

    JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

  • HTML

    8938questions

    HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

  • JSON

    1148questions

    JSON(JavaScript Object Notation)は軽量なデータ記述言語の1つである。構文はJavaScriptをベースとしていますが、JavaScriptに限定されたものではなく、様々なソフトウェアやプログラミング言語間におけるデータの受け渡しが行えるように設計されています。

  • パース

    6questions

    パースとは、一定の文法に従って記述されたテキスト文書を解析し、データ構造の集合体に分解・変換することを呼びます。

HTMLから特定部分をJSON形式で抽出したい

解決済

回答 1

投稿

  • 評価
  • クリップ 1
  • VIEW 192

ddp

score 3

表題の件の通りです。
以下htmlファイルになります。

<div id="contents" role="main">
  <!--カテゴリ-->
  <section class="listblock">
    <div class="programlist normal ranking">
      <h2>カテゴリ1</h2>
      <div class="listinner">
        <ul>
          <li class="resumable" data-ref-id="1">
          <a href="/corner/aaaa/" class="detail_link" data-pos="popular">
            <div class="pic"><div class="picinner" style="background-image:url(https://hogehoge.sample1.jpg);">ああああああああ</div></div>
            <div class="rank">1</div>
            <div class="progtitle">
              <h3>ああああああああ</h3>
              <p class="summary">1巻</p>
              <p class="tv">AAAAAAAA</p>
            </div>
          </a>
          </li>
          <li class="resumable" data-ref-id="2">
          <a href="/episode/bbbb/" class="detail_link" data-pos="popular">
            <div class="pic"><div class="picinner" style="background-image:url(https://hogehoge.sample2.jpg);">いいいいいいいい</div></div>
            <div class="rank">2</div>
            <div class="progtitle">
              <h3>いいいいいいいい</h3>
              <p class="summary"> </p>
              <p class="tv">BBBBBBBB</p>
            </div>
          </a>
          </li>
          <li class="resumable" data-ref-id="3">
          <a href="/episode/cccc/" class="detail_link" data-pos="popular">
            <div class="pic"><div class="picinner" style="background-image:url(https://hogehoge.sample2.jpg);">うううううううう</div></div>
            <div class="rank">3</div>
            <div class="progtitle">
              <h3>うううううううう</h3>
              <p class="summary">1巻</p>
              <p class="tv">CCCCCCCC</p>
            </div>
          </a>
          </li>
        </ul>
      </div>
    </div>
  </section>


上記HTMLより以下のようなJSONデータを抜き取りたいのです。

[
{"thumbnail": "https://hogehoge.sample1.jpg", "title": "ああああああああ", "link": "/corner/aaaa/"},
{"thumbnail": "https://hogehoge.sample2.jpg", "title": "いいいいいいいい", "link": "/episode/bbbb/"},
{"thumbnail": "https://hogehoge.sample3.jpg", "title": "うううううううう", "link": "/episode/cccc/"}
]


<試したこと>
こちらを使用して試してみたのですが、thumbnailとして抜き取りたいURL部分をうまく抽出できませんでした。
こちらも試そうとしているのですが、使い方がイマイチよくわかりません。

何せほんとに素人で頼れる人もいません。。。頭がパンクしそうになってしまい、こちらで質問させていただきました。
上記の試してみたツール以外の方法でも全くかまいませんので、
御助言頂けるとありがたいです。

よろしくお願いいたします。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • yambejp

    2018/06/29 19:46

    phpでよいのですか?それともクライアントのjavascriptを想定していますか?その場合jQueryなどの利用は可能ですか?

    キャンセル

  • ddp

    2018/06/29 20:47

    コメントありがとうございます。php、javascriptのどちらでも構いません。ただjQueryについては当方知見がありません。ただこれを機に調べてみる気はあります。よろしくお願い致します。

    キャンセル

回答 1

checkベストアンサー

+1

jQueryでもよいようなのでこう
(コピペできるようjQueryのライブラリのpathまで書いておきます)

<script src="http://ajax.googleapis.com/ajax/libs/jquery/1.12.4/jquery.min.js"></script>
<script>
$(function(){
  var a=$('.picinner').map(function(){
    return {
    thumbnail:$(this).css("background-image").match(/\"(.+?)\"/)[1],
    title:$(this).text(),
    link:$(this).closest(".detail_link").attr("href"),
    };
  }).get();
  console.log(a);
  console.log(JSON.stringify(a));
});
</script>

<div id="contents" role="main">
  <!--カテゴリ-->
  <section class="listblock">
    <div class="programlist normal ranking">
      <h2>カテゴリ1</h2>
      <div class="listinner">
        <ul>
          <li class="resumable" data-ref-id="1">
          <a href="/corner/aaaa/" class="detail_link" data-pos="popular">
            <div class="pic"><div class="picinner" style="background-image:url(https://hogehoge.sample1.jpg);">ああああああああ</div></div>
            <div class="rank">1</div>
            <div class="progtitle">
              <h3>ああああああああ</h3>
              <p class="summary">1巻</p>
              <p class="tv">AAAAAAAA</p>
            </div>
          </a>
          </li>
          <li class="resumable" data-ref-id="2">
          <a href="/episode/bbbb/" class="detail_link" data-pos="popular">
            <div class="pic"><div class="picinner" style="background-image:url(https://hogehoge.sample2.jpg);">いいいいいいいい</div></div>
            <div class="rank">2</div>
            <div class="progtitle">
              <h3>いいいいいいいい</h3>
              <p class="summary"> </p>
              <p class="tv">BBBBBBBB</p>
            </div>
          </a>
          </li>
          <li class="resumable" data-ref-id="3">
          <a href="/episode/cccc/" class="detail_link" data-pos="popular">
            <div class="pic"><div class="picinner" style="background-image:url(https://hogehoge.sample2.jpg);">うううううううう</div></div>
            <div class="rank">3</div>
            <div class="progtitle">
              <h3>うううううううう</h3>
              <p class="summary">1巻</p>
              <p class="tv">CCCCCCCC</p>
            </div>
          </a>
          </li>
        </ul>
      </div>
    </div>
  </section>

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/06/29 21:02

    titleはdivの中身なのかh3の方からとるのかわかりませんね

    キャンセル

  • 2018/06/29 21:34

    返信ありがとうございます。すみません、説明不足でした。
    titleについてはどちらから取っても良いです。
    内容をすぐには理解できませんので、把握しましたらまた連絡させてください。
    よろしくお願いいたします。

    キャンセル

  • 2018/06/29 23:34 編集

    頂いたコードをhtmlにて確認したところ所望のarrayがconsoleにて確認できました。
    ただ申し訳ありません説明不足でしたが、実際にやりたいことはWEB上のhtmlをダウンロードし、別途用意したスクリプトファイル実行するとJSON形式のtxtファイルを吐き出すような仕組みにしたいのです。

    キャンセル

  • 2018/07/02 12:57

    >WEB上のhtmlをダウンロードし、別途用意したスクリプトファイル実行する

    ダウンロードしたファイルなら、ローカルにhttpdを立ち上げて
    ajaxで呼び出して処理するとか、phpでクロールしてdomで処理するとか
    でしょうかね・・・

    キャンセル

  • 2018/07/03 14:25

    ご連絡遅くなりました。
    なるほど、アドバイスありがとうございます。
    httpdは最近触れたばかりなので、ちょうど良い勉強になりそうです。
    raspberrypiにてアドバイス内容を構築する検討を進めてみたいと思います。
    進展ありましたらコメントさせてください、よろしくお願いいたします。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.52%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

  • 解決済

    AngularJSでui-routerを使用した際、入れ子内のページでjavascriptが動作しな...

    AngularJS 1.4.3でui-routerを使用して複数の画面に遷移でき、 サーバサイドと非同期で通信してデータを取得・表示する フロントエンドアプリケーションを作っている

  • 解決済

    SEを使い分けたい。

    現在Monaca(HTML5+JavaScriptのアプリ開発プラットフォーム)を使用してiosアプリ開発に取り組んでおります。 アプリ画面上に画像を2つ置いていて、タップした

  • 解決済

    アクセス解析の異常?

    この場にふさわしい質問かは分かりませんが質問させて下さい。 当方、https://noukinsinsi.comでブログをやっているのですが、今月の13日を境にPVが半減しまし

  • 受付中

    Bootstrapにcamera slideshowを設定したらスマフォサイズでハンバーガーメニュー...

    前提・実現したいこと Bootstrapにcamera slideshowを設定したらスマフォサイズでハンバーガーメニューが表示されなくなった。アイコンは表示されるが、メニューバー

  • 解決済

    Bootstrapのファイル選択のレイアウトについて

    前提・実現したいこと ファイル選択のinputタグにbootstrapが当たらないので、 https://qiita.com/nakapython/items/46d4479382

  • 解決済

    FlexSlider使用時に画像が表示されない

    実現したいこと FlexSliderを使用して画像ギャラリーを作りたい 発生している問題 画像が表示されない…基本的な箇所でどこかミスがあるのではとは思っています。 <

  • 解決済

    justify-contentが効かない

    前提・実現したいこと ruby on railsで教材を参考にしながらサイトを作っています。 発生している問題・エラーメッセージ justify-contentが効かない なぜ

  • 受付中

    Bootstrapでのスライドについて

    前提・実現したいこと スライドするための<と>のボタンを表示 発生している問題・エラーメッセージ (ブラウザはFirefoxです) Bootstrapで画像のスライドを実装さ

同じタグがついた質問を見る

  • PHP

    20298questions

    PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

  • JavaScript

    16362questions

    JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

  • HTML

    8938questions

    HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

  • JSON

    1148questions

    JSON(JavaScript Object Notation)は軽量なデータ記述言語の1つである。構文はJavaScriptをベースとしていますが、JavaScriptに限定されたものではなく、様々なソフトウェアやプログラミング言語間におけるデータの受け渡しが行えるように設計されています。

  • パース

    6questions

    パースとは、一定の文法に従って記述されたテキスト文書を解析し、データ構造の集合体に分解・変換することを呼びます。