許可をもらった複数サイト内の全コンテンツを対象に定期的にクロールしてソースを取得するクローラーを作ろうと思っています。(JavaScriptのリンクも読み取る仕様で)
最低でも100サイト✕1000ページくらいを巡回する事ができるようなものを作ろうと思うのですが、どのような言語?を学習すればよいでしょうか?
ネットで色々調べたところ、
VPS(さくらVPSが良さそう?)を契約して
python、Seleniumを覚えれば
なんとかなるのかな???って感じがしているのですが、まったくもって確証がもてません。
当方、HTML、CSS、PHP、Javascriptくらいしか分からず、サーバ周りも詳しくありません。
上記用途のような場合、どのような学習方法が最適でしょうか。
どの言語が良い。どのページが参考になる。どの本が良い等、何でも良いので情報を教えていただければ幸いです。
よろしくお願いいたしますm(_ _)m
回答3件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。