0
0
一時的にデータを取得したいケースと
自動で流し込みたいケースがあるかと思われますが、
スクレイピングしようと考える人間は、本質的にどちらが多いんでしょうか
一時的なデータであれば頑張ってコピペでいいと思いますが、
スクレイピングしようと思う人間は後者のケースが多いのでしょうか
気になる質問をクリップする
クリップした質問は、後からいつでもMYページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
回答5件
#1
総合スコア192
投稿2025/04/21 01:27
自分はスクレイピングしたことないですが、コピペで追いつかないからしているケースが多いと思うので、質問の二択だと
自動で流し込みたいケースがあるかと思われますが、
こちらな感じがしますね
#2
総合スコア86489
投稿2025/04/21 01:42
編集2025/04/21 01:49そんなことを気にしてもしょうがないと思うのですが、質問意図はなんでしょうか?
そもそも、「全て手動でブラウザ画面からコピペ」もスクレイピングですが、おそらく「(RPA等も含めた)プログラムを書いてのスクレイピング」の事ですよね。
私は「この作業は絶対に一度きりだが、全手動コピペは面倒」と思うときは、ブラウザの開発者ツールでHTMLソースを取得してファイルに保存し、nokogiri aaa.htmlと対話型操作でスクレイピングすることもありますね(※1)。テーブルならExcelにコピペすることもあります。データ数個で面倒でなければ1つずつ手動コピペももちろんします。
(※1 一度きりならHTML取得のコードは書かないが、HTMLからデータを取得するコードは書くかもと言うこと。nokogiriはRubyで書かれたHTML(XML)構文解析パッケージ)
目的があって手段を選ぶので、目的を聞くなら「スクレイピングしたい時って、一度きりの作業で手動でも可能なケースと、毎日とか毎時とかの作業で手動では非現実的なケースと、どちらが多いでしょうか?」でしょうけど、それを聞いて何の意味があるのか分かりません。
あるいは手段を聞くなら「今回一度きり作業のスクレイピングと分かっていて、手動でも可能なんだけど、プログラムを書くことがありますか?」がですかね?これも何の意味があるのか分かりません。
#3
総合スコア118236
投稿2025/04/21 03:14
自分がどうしたいか、そのやり方が効率的か?という質問ならソース次第で可否を判断できますが他人がどうしているかなんて気にしても仕方ないです
#4
総合スコア11049
投稿2025/04/21 11:24
一時的にデータを取得したいケースと
自動で流し込みたいケースがあるかと思われますが、
スクレイピングしようと考える人間は、本質的にどちらが多いんでしょうか
一時的なデータであれば頑張ってコピペでいいと思いますが、
スクレイピングしようと思う人間は後者のケースが多いのでしょうか
データ量の問題だと思います。一度限りあっても1万回コピペできますか?私にはできないので自動化できないか検討しますね。
#5
総合スコア876
投稿2025/04/22 01:36
一時的にデータを取得 = 手動実行
自動で流し込みたい = 定期実行
みたいに捉えました
これらはやりたいこと(更新頻度とその更新情報の重要性)によるんじゃないでしょうか。
数年に一度不定期に更新されるような情報や、更新された情報がリアルタイムで反映される必要がないものは手動でも構わないですし、逆なら定期実行する形になると思います。
が、相手のサーバーへ不要な負荷を与えてしまうことを考えて結局は定期実行するような設計にはならないんじゃないかなと思います。