質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

Q&A

解決済

3回答

2014閲覧

「file_put_contents」関数のサーバー負荷について

退会済みユーザー

退会済みユーザー

総合スコア0

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

0グッド

0クリップ

投稿2018/11/17 01:52

編集2018/11/19 01:21

PHPを学習中で、外部サイトの画像を保存するプログラムを作成しました。
まだまだ初歩段階で外部サイトの画像URLが連番の場合のみ動作する物なのですが、「file_put_contents」を使用した場合、
数枚ならいいですが、何百の画像を保存させようとしたとき外部サーバーに負担がものすごくかかってしまうものなのでしょうか。
負荷がかかってしまう場合、こういった保存したい物の場合、何か回避方法などあるのでしょうか?
よろしくお願いいたします。

<?php set_time_limit(0); $error = ''; if(isset($_POST['syutoku'])){ $get_img = $_POST['number']; $url = $_POST['url']; if(isset($get_img) && isset($url)){ for($i=1;$i<=$get_img;$i++){ $url_img = $url . sprintf('%05d', $i).'.jpg'; $context = stream_context_create(array( 'http' => array('ignore_errors' => true) )); $img = file_get_contents($url_img,false,$context); $imginfo = pathinfo($url_img); $img_name = $imginfo['basename']; file_put_contents('./img/' . $img_name, $img); } }else{ $error = 'フォームに値を入力してください。'; } } ?> <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <meta http-equiv="X-UA-Compatible" content="ie=edge"> <title>外部サイト画像ダウンロード</title> </head> <body> <h1>外部サイト画像ダウンロード</h1> <p>取得する外部サイトURLと画像の最大ファイル数字を入力してください。</p> <?php if($error){ echo '<p>' .$error. '</p>'; } ?> <form method="post" action="index.php"> <p>サイトURL:<input type="text" value="" name="url"></p> <p>最大数字:<input type="text" value="" name="number"></p> <p><input type="submit" name="syutoku" value="画像取得"></p> </form> </body> </html>

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

外部サーバーに負担がものすごくかかってしまうものなのでしょうか。

まぁ十中八九の理由で、用途が人に言えないようなものでしょうけど、
極めて善意的に解釈すればWebコミックなどで作者が公開している画像ファイルですね。

別にブラウザで見ても全てのページを見るつもりなら全画像ファイルにアクセスしてDLしているわけで、
それがPHPがfile_get_contentでのアクセスに変わろうが、実際にかかるトラフィック量は全く同じです。
むしろHTML・JS・CSSファイルを読み込まない分だけ軽いまであります。

しかしながらHTTP/2というページを構成するのに必要な画像ファイルを一撃で全て落としてくるような仕組みがありますので、file_get_contentsでちまちま1娘ずつDLする行為はその都度TCPの3ハンドシェイクが行われるので死ぬほど遅くなります。
ただまぁトラフィックという程でもないですかね。

負荷がかかってしまう場合、こういった保存したい物の場合、何か回避方法などあるのでしょうか?

常識の範囲でやってください。
人間が一度に100のファイルをDLしにかかるような事はそうそうなく、大したトラフィックは専有しません。
不自然にトラフィックを跳ね上げるようなアクセスの仕方をするのは大抵が貴方の作ったようなスクリプトやBOTと呼ばれるような存在です。

それに対する対策として、Amazonのようなサービスではそういった輩を見つけ次第IPアドレスやアカウント剥奪等してアクセス禁止処置をしています。

画像1枚DLする度に数秒の時間を置くなどして先方のサーバーの事情を考慮したり、
URLが同一のものはキャッシュとして所持しておき、先方のサーバーに画像を取りに行かずHDD内に保存したものを返す等、アクセス回数を減らす工夫してください。

とりあえずPHPにはsleepという関数がありますので、ループ文の最後に仕込んでみるなどして先方のサーバーを休ませるようにしてあげてください。

投稿2018/11/17 02:27

miyabi-sun

総合スコア21158

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

m.ts10806

2018/11/17 02:40

質問者さん 回答読まずに逃亡した感じですね。 編集履歴から元の内容確認できるのにご丁寧に編集して…
guest

0

そもそも外部サイトにプログラムで勝手にアクセスして勝手に自動保存して良いのか、という話ですね。
掲載画像を自由に取得しても構わない旨が提起されていて、1つ1つ「右クリック画像で保存」するような形とか
APIでサイトから配布方法が提供されているならまだしも
プログラムで自動で何百枚も取得するのは負荷を心配する前に心配しなければならないことだと思います。
※スクレイピングみたいなものなので、その「心配すべきこと」は同じかと思います

負荷がかかってしまう場合、こういった保存したい物の場合、何か回避方法などあるのでしょうか?

「やらない」という選択以外ないかと。
例え外部公開しない・・とあっても結局そのサイトへのアクセスは発生するわけです。
他の質問の回答でも指摘されていましたが、アクセス元を特定するのって難しくありません。

「数枚ならいい」という考え方は非常に危険です。
バレなければ捕まらなければ赤信号を無視していい、盗んでもいい というのと同じ考え方です。

投稿2018/11/17 02:05

編集2018/11/17 02:23
m.ts10806

総合スコア80850

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

ベストアンサー

file_put_contentsの負荷ということですが、保存時に外部サーバに負荷はかかりません。何百枚あろうと。

投稿2018/11/17 02:13

papinianus

総合スコア12705

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問