質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

HTML5

HTML5 (Hyper Text Markup Language、バージョン 5)は、マークアップ言語であるHTMLの第5版です。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

jQuery

jQueryは、JavaScriptライブラリのひとつです。 簡単な記述で、JavaScriptコードを実行できるように設計されています。 2006年1月に、ジョン・レシグが発表しました。 jQueryは独特の記述法を用いており、機能のほとんどは「$関数」や「jQueryオブジェクト」のメソッドとして定義されています。

Q&A

0回答

766閲覧

アメーバブログの新着記事(サムネ・タイトル・投稿日)をスクレイピングで取得したい

doradoradora

総合スコア0

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

HTML5

HTML5 (Hyper Text Markup Language、バージョン 5)は、マークアップ言語であるHTMLの第5版です。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

jQuery

jQueryは、JavaScriptライブラリのひとつです。 簡単な記述で、JavaScriptコードを実行できるように設計されています。 2006年1月に、ジョン・レシグが発表しました。 jQueryは独特の記述法を用いており、機能のほとんどは「$関数」や「jQueryオブジェクト」のメソッドとして定義されています。

0グッド

0クリップ

投稿2020/09/01 11:57

前提・実現したいこと

phpQuery-onefile.phpにてアメーバーブログの新着記事をスクレイピング。PHP初心者です。

アメーバブログの新着記事のサムネイル・記事タイトル・投稿日を取得してHTMLに出力したいと思っています。PHP初心者でかなりコードが汚いと思うんですが、ご了承ください。

知恵を貸していただければ幸いです。

発生している問題・エラーメッセージ

取得したい項目が取得できない。

取得したい項目(6件分)
・サムネイル(成功)
・記事タイトル(成功)
・投稿日(失敗)

日付がpタグで囲われていたのでそれを狙ってコードを書いてみたのですが、何も取得できませんでした。pについているクラスでも試みたのですが何も取得できませんでした。

該当のソースコード

php

1<?php 2 3// phpQueryの読み込み 4require_once("phpQuery-onefile.php"); 5 6// HTMLデータを取得する 7$HTMLData = file_get_contents('https://ameblo.jp/[**ameba ID**]/entrylist.html'); 8 9// HTMLをオブジェクトとして扱う 10$doc = phpQuery::newDocument($HTMLData)->find('#primary'); 11 12echo "<ul>"; 13foreach ($doc[".skin-borderQuiet:lt(5)"] as $entry){ 14 $h1 = pq($entry)->find('h2')->text();//タイトルの取得 15 $img = pq($entry)->find('img:eq(1)');//サムネイルの取得 16 $date = pq($entry)->find('p')->text();// 日付の取得 17 18 echo "<li>"; 19 echo "<div'>".$img."</div>"; 20 echo "<div><time>".$date."</time>".$h1."</div>"; 21 echo "</li>"; 22} 23echo "</ul>"; 24?> 25

試したこと

当初はRSSでのサムネイル取得を目指したのですが、どうしても出来ずに断念しました。初めてスクレイピングです。

補足情報(FW/ツールのバージョンなど)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

m.ts10806

2020/09/01 23:59

そもそも許可なくスクレイピングして良いサイトなのでしょうか。 ダメな場合、「初心者だから許して」は通じませんよ
doradoradora

2020/09/03 15:38

ご指摘ありがとうございます。
m.ts10806

2020/09/03 22:26 編集

指摘と言うより警告に近いと思ってください。 技術的に可能だからとなんでもやっていいわけではありません。車での逆走、住居侵入 これらも同じ。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問