質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
JSON

JSON(JavaScript Object Notation)は軽量なデータ記述言語の1つである。構文はJavaScriptをベースとしていますが、JavaScriptに限定されたものではなく、様々なソフトウェアやプログラミング言語間におけるデータの受け渡しが行えるように設計されています。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

パース

パースとは、一定の文法に従って記述されたテキスト文書を解析し、データ構造の集合体に分解・変換することを呼びます。

JavaScript

JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

Q&A

解決済

1回答

1744閲覧

HTMLから特定部分をJSON形式で抽出したい

ddp

総合スコア17

JSON

JSON(JavaScript Object Notation)は軽量なデータ記述言語の1つである。構文はJavaScriptをベースとしていますが、JavaScriptに限定されたものではなく、様々なソフトウェアやプログラミング言語間におけるデータの受け渡しが行えるように設計されています。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

パース

パースとは、一定の文法に従って記述されたテキスト文書を解析し、データ構造の集合体に分解・変換することを呼びます。

JavaScript

JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

0グッド

1クリップ

投稿2018/06/29 10:30

表題の件の通りです。
以下htmlファイルになります。

html

1<div id="contents" role="main"> 2 <!--カテゴリ--> 3 <section class="listblock"> 4 <div class="programlist normal ranking"> 5 <h2>カテゴリ1</h2> 6 <div class="listinner"> 7 <ul> 8 <li class="resumable" data-ref-id="1"> 9 <a href="/corner/aaaa/" class="detail_link" data-pos="popular"> 10 <div class="pic"><div class="picinner" style="background-image:url(https://hogehoge.sample1.jpg);">ああああああああ</div></div> 11 <div class="rank">1</div> 12 <div class="progtitle"> 13 <h3>ああああああああ</h3> 14 <p class="summary">1巻</p> 15 <p class="tv">AAAAAAAA</p> 16 </div> 17 </a> 18 </li> 19 <li class="resumable" data-ref-id="2"> 20 <a href="/episode/bbbb/" class="detail_link" data-pos="popular"> 21 <div class="pic"><div class="picinner" style="background-image:url(https://hogehoge.sample2.jpg);">いいいいいいいい</div></div> 22 <div class="rank">2</div> 23 <div class="progtitle"> 24 <h3>いいいいいいいい</h3> 25 <p class="summary"> </p> 26 <p class="tv">BBBBBBBB</p> 27 </div> 28 </a> 29 </li> 30 <li class="resumable" data-ref-id="3"> 31 <a href="/episode/cccc/" class="detail_link" data-pos="popular"> 32 <div class="pic"><div class="picinner" style="background-image:url(https://hogehoge.sample2.jpg);">うううううううう</div></div> 33 <div class="rank">3</div> 34 <div class="progtitle"> 35 <h3>うううううううう</h3> 36 <p class="summary">1巻</p> 37 <p class="tv">CCCCCCCC</p> 38 </div> 39 </a> 40 </li> 41 </ul> 42 </div> 43 </div> 44 </section>

上記HTMLより以下のようなJSONデータを抜き取りたいのです。

JSON

1[ 2{"thumbnail": "https://hogehoge.sample1.jpg", "title": "ああああああああ", "link": "/corner/aaaa/"}, 3{"thumbnail": "https://hogehoge.sample2.jpg", "title": "いいいいいいいい", "link": "/episode/bbbb/"}, 4{"thumbnail": "https://hogehoge.sample3.jpg", "title": "うううううううう", "link": "/episode/cccc/"} 5]

<試したこと>
こちらを使用して試してみたのですが、thumbnailとして抜き取りたいURL部分をうまく抽出できませんでした。
こちらも試そうとしているのですが、使い方がイマイチよくわかりません。

何せほんとに素人で頼れる人もいません。。。頭がパンクしそうになってしまい、こちらで質問させていただきました。
上記の試してみたツール以外の方法でも全くかまいませんので、
御助言頂けるとありがたいです。

よろしくお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

yambejp

2018/06/29 10:46

phpでよいのですか?それともクライアントのjavascriptを想定していますか?その場合jQueryなどの利用は可能ですか?
ddp

2018/06/29 11:47

コメントありがとうございます。php、javascriptのどちらでも構いません。ただjQueryについては当方知見がありません。ただこれを機に調べてみる気はあります。よろしくお願い致します。
guest

回答1

0

ベストアンサー

jQueryでもよいようなのでこう
(コピペできるようjQueryのライブラリのpathまで書いておきます)

javascript

1<script src="http://ajax.googleapis.com/ajax/libs/jquery/1.12.4/jquery.min.js"></script> 2<script> 3$(function(){ 4 var a=$('.picinner').map(function(){ 5 return { 6 thumbnail:$(this).css("background-image").match(/\"(.+?)\"/)[1], 7 title:$(this).text(), 8 link:$(this).closest(".detail_link").attr("href"), 9 }; 10 }).get(); 11 console.log(a); 12 console.log(JSON.stringify(a)); 13}); 14</script> 15 16<div id="contents" role="main"> 17 <!--カテゴリ--> 18 <section class="listblock"> 19 <div class="programlist normal ranking"> 20 <h2>カテゴリ1</h2> 21 <div class="listinner"> 22 <ul> 23 <li class="resumable" data-ref-id="1"> 24 <a href="/corner/aaaa/" class="detail_link" data-pos="popular"> 25 <div class="pic"><div class="picinner" style="background-image:url(https://hogehoge.sample1.jpg);">ああああああああ</div></div> 26 <div class="rank">1</div> 27 <div class="progtitle"> 28 <h3>ああああああああ</h3> 29 <p class="summary">1</p> 30 <p class="tv">AAAAAAAA</p> 31 </div> 32 </a> 33 </li> 34 <li class="resumable" data-ref-id="2"> 35 <a href="/episode/bbbb/" class="detail_link" data-pos="popular"> 36 <div class="pic"><div class="picinner" style="background-image:url(https://hogehoge.sample2.jpg);">いいいいいいいい</div></div> 37 <div class="rank">2</div> 38 <div class="progtitle"> 39 <h3>いいいいいいいい</h3> 40 <p class="summary"> </p> 41 <p class="tv">BBBBBBBB</p> 42 </div> 43 </a> 44 </li> 45 <li class="resumable" data-ref-id="3"> 46 <a href="/episode/cccc/" class="detail_link" data-pos="popular"> 47 <div class="pic"><div class="picinner" style="background-image:url(https://hogehoge.sample2.jpg);">うううううううう</div></div> 48 <div class="rank">3</div> 49 <div class="progtitle"> 50 <h3>うううううううう</h3> 51 <p class="summary">1</p> 52 <p class="tv">CCCCCCCC</p> 53 </div> 54 </a> 55 </li> 56 </ul> 57 </div> 58 </div> 59 </section>

投稿2018/06/29 12:01

yambejp

総合スコア114779

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

yambejp

2018/06/29 12:02

titleはdivの中身なのかh3の方からとるのかわかりませんね
ddp

2018/06/29 12:34

返信ありがとうございます。すみません、説明不足でした。 titleについてはどちらから取っても良いです。 内容をすぐには理解できませんので、把握しましたらまた連絡させてください。 よろしくお願いいたします。
ddp

2018/06/30 02:34 編集

頂いたコードをhtmlにて確認したところ所望のarrayがconsoleにて確認できました。 ただ申し訳ありません説明不足でしたが、実際にやりたいことはWEB上のhtmlをダウンロードし、別途用意したスクリプトファイル実行するとJSON形式のtxtファイルを吐き出すような仕組みにしたいのです。
yambejp

2018/07/02 03:57

>WEB上のhtmlをダウンロードし、別途用意したスクリプトファイル実行する ダウンロードしたファイルなら、ローカルにhttpdを立ち上げて ajaxで呼び出して処理するとか、phpでクロールしてdomで処理するとか でしょうかね・・・
ddp

2018/07/03 05:25

ご連絡遅くなりました。 なるほど、アドバイスありがとうございます。 httpdは最近触れたばかりなので、ちょうど良い勉強になりそうです。 raspberrypiにてアドバイス内容を構築する検討を進めてみたいと思います。 進展ありましたらコメントさせてください、よろしくお願いいたします。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問