質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Heroku

HerokuはHeroku社が開発と運営を行っているPaaSの名称です。RubyやNode.js、Python、そしてJVMベース(Java、Scala、Clojureなど)の複数のプログラミング言語をサポートしている。

Docker

Dockerは、Docker社が開発したオープンソースのコンテナー管理ソフトウェアの1つです

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

3回答

1942閲覧

Pythonの無限ループ(Webスクレイピング)を実装する環境について

yuki-yuki-

総合スコア2

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Heroku

HerokuはHeroku社が開発と運営を行っているPaaSの名称です。RubyやNode.js、Python、そしてJVMベース(Java、Scala、Clojureなど)の複数のプログラミング言語をサポートしている。

Docker

Dockerは、Docker社が開発したオープンソースのコンテナー管理ソフトウェアの1つです

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

2クリップ

投稿2021/05/05 08:37

こんにちは。

私は、現在実装したいプログラムがあります。

内容は、Python・Seleniumを用いたWebスクレイピングなのですが、このコードをWhileループを用いて組んでおります。

ローカル環境のJupyter Lab, Visual Studio Codeを用いれば容易に実装できるのですが、その場合PCを24時間起動しておく必要があると思います。

PCをずっとつけておかない方法で、この無限ループを実装する方法はありませんか?

私が、考えた方法は、「heroku」を用いる方法、「Docker」を用いる方法でしたが、Chrome webdriverをどのように組み込めばいいのかわかりませんでした。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

hoshi-takanori

2021/05/05 09:27

それって単なる迷惑行為では。
guest

回答3

0

そのサイトにから24時間たえまなく情報を取得していいとはあまり思えないのは他の方と同様ですが、

  • 自宅のPCを常時稼動させておく
  • 自宅に小さなサーバを立てて常時起動してそこで動かす。
  • レンタルサーバを借りる
  • HerokuなどのPasSを利用する

などいろいろあります。

Dockerというのは、それらに環境を含めて実装/デプロイする方法なので、次元が違います。

投稿2021/05/05 11:04

TakaiY

総合スコア12747

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

ベストアンサー

無限ループでスクレイピングという時点で対象となるサーバーへの無制限の負荷をかけるという事はある種のサーバー攻撃になってしまうのでここは問題外の話として
毎日(もしくは1時間おきなどの定期的な)決まった時間帯だけに絞って対象のページをスクレイピングしてデータを更新するという手段ならば
ローカルで開発したアプリをクラウドサーバーサービスにデプロイしてそのサーバーにcronを設定するなどなら可能です。
https://www.server-memo.net/tips/crontab.html

HerokuでChromeDriverを利用する場合はHerokuが用意している専用のビルドパックの利用ができます

https://elements.heroku.com/buildpacks/heroku/heroku-buildpack-chromedriver

投稿2021/05/05 09:32

sika

総合スコア52

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

yuki-yuki-

2021/05/06 05:12

24時間アクセスし続けるというのは、確かに現実的ではなかったです。 まずは、sikaさんの意見を参考にして、Herokuでスクレイピングの定期実行をやってみようと思います。
guest

0

あなたの考えた方法のいずれを使ったところで、

PCをずっとつけておかない方法で、この無限ループを実装する方法はありませんか?

これを実現できないと思いますが

投稿2021/05/05 08:50

y_waiwai

総合スコア87749

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問