質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Beautiful Soup

Beautiful Soupは、Pythonのライブラリの一つ。スクレイピングに特化しています。HTMLデータの構文の解析を行うために、HTMLタグ/CSSのセレクタで抽出する部分を指定することが可能です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

AWS(Amazon Web Services)

Amazon Web Services (AWS)は、仮想空間を機軸とした、クラスター状のコンピュータ・ネットワーク・データベース・ストーレッジ・サポートツールをAWSというインフラから提供する商用サービスです。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

VPS

VPS(バーチャル・プライベート・サーバ)は、仮想化されたサーバをレンタルするサービスで、共有サーバでありながら専門サーバと同等の機能を果たします。物理的な専門サーバより安価で提供できるメリットがあります。

Q&A

解決済

2回答

949閲覧

適切なサーバーサービス選び 料金イメージ

akibin-0219

総合スコア9

Beautiful Soup

Beautiful Soupは、Pythonのライブラリの一つ。スクレイピングに特化しています。HTMLデータの構文の解析を行うために、HTMLタグ/CSSのセレクタで抽出する部分を指定することが可能です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

AWS(Amazon Web Services)

Amazon Web Services (AWS)は、仮想空間を機軸とした、クラスター状のコンピュータ・ネットワーク・データベース・ストーレッジ・サポートツールをAWSというインフラから提供する商用サービスです。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

VPS

VPS(バーチャル・プライベート・サーバ)は、仮想化されたサーバをレンタルするサービスで、共有サーバでありながら専門サーバと同等の機能を果たします。物理的な専門サーバより安価で提供できるメリットがあります。

0グッド

0クリップ

投稿2021/03/02 07:00

編集2021/03/02 08:08

現在自分は pythonのseleniumとbeautiful soup を使って毎日、朝と深夜の一日二回スクレイピングを行い、その結果をpostgresqlに書き込んでログを取る  というものを作っております。
スクレイピングとdb書き込み機能を持ったスクリプトは完成しており、これをVPSやAWS EC2などでサーバーを立ててcronで毎日決まった時間に実行してログを取ろうと考えているのですが、
このようなwebなど外部のアクセスがないようなものを目的としている場合どのサーバーサービスをつかうのが適切なのでしょうか(なるべく安くしたい)
また、なんとなくでもいいのでAWSを利用した時の予想される料金も教えていただけたら嬉しいです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

m.ts10806

2021/03/02 07:51

>というのを目的 細かくて申し訳ないですが、書かれているのはあくまで手段です。 「なんのために」が目的です。 AWSの料金は調べれば出てくる範囲でしょうし、そもそもAWSでいいのか スクレイピングして問題ない先なのか というところの検討は必須では。場合により訴えられることもあります。
akibin-0219

2021/03/02 08:13

日本語がおかしかったですね・・ ご指摘ありがとうございます。 AWSの利用料金に関しては自分の方でも調べてみたのですがサービスの種類が多く、AWSのサービスについての理解が浅い自分としてはあまり理解ができず、また料金実例も自分の調べた限りではwordpressなどのwebサーバの例がほとんどだったので、質問させていただきました。
guest

回答2

0

ベストアンサー

このようなwebなど外部のアクセスがないようなものを目的としている場合どのサーバーサービスをつかうのが適切なのでしょうか(なるべく安くしたい)

外部からアクセスされる必要が無い&
仮に落ちても許容できる&
常識的な量のネットワーク使用の範囲で収まるという条件であれば、
RaspberryPiやその他の省電力なPCを用意して自宅で常時稼働&クローリングさせるのが最も安くなるはずです。

AWS等の従量課金サービスでどの程度コストがかかるかについては、どの程度のアクセスがあるのか、負荷があるのか、ストレージがどの程度必要なのかなどなどの各種要件が分からないことには、外部の人間に判断することは難しいです。

ただ、AWSには無料枠があるので(AWS 無料利用枠)、まずは無料枠内でEC2なりLightSailなりを立てて試してみるのが良いかと思いますよ。
(maisumakunさんの回答通り、どのみち確認は必要ですし)

使ってみて、スペックが足りなければそれよりはコストがかかりますし、余裕なら(無料期間が終わった後にでも)小さなインスタンスに変更すればより安くなります。

投稿2021/03/02 07:26

tanat

総合スコア18713

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

akibin-0219

2021/03/02 08:20

なるほどです。いったんAWSの無料利用枠で稼働してみてます! ラズパイに関してはあまり考えていませんでしたが、やはり一番安く済む方法として有力なのですね・・ 今後、AWSの無料枠で稼働させつつ、最終的にラズパイでサーバを作るのを目標にしていきたいと思います。
guest

0

まずは、AWSで動作するのかの確認が必要です。

クローラによるアクセスを防ぐために、AWSの帯域からのアクセスをブロックしているサイトも存在します。

投稿2021/03/02 07:12

maisumakun

総合スコア145186

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

akibin-0219

2021/03/02 08:07

なるほどです、AWS帯域を対象にブロックすることもあるのですね・・ ありがとうございます、確認してみます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問