質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Webサイト

一つのドメイン上に存在するWebページの集合体をWebサイトと呼びます。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

API

APIはApplication Programming Interfaceの略です。APIはプログラムにリクエストされるサービスがどのように動作するかを、デベロッパーが定めたものです。

Q&A

2回答

673閲覧

Webスクレイピングの規約とAPIの提供について

pythonbegginer

総合スコア25

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Webサイト

一つのドメイン上に存在するWebページの集合体をWebサイトと呼びます。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

API

APIはApplication Programming Interfaceの略です。APIはプログラムにリクエストされるサービスがどのように動作するかを、デベロッパーが定めたものです。

1グッド

1クリップ

投稿2020/04/03 10:05

Pythonを初めて数日の初心者で、プログラミングも勉強始めたばかりです。
最終的にWebスクレイピングができるようになりたいと思っています。

■Webスクレイピングやクローリングはちゃんと規約を確認してからやらないと法律違反になるということは分かりました。

そこで2点質問なのですが、
①ガイドラインがきちんとないサイトとかでも、例えば自分のスキルが後々ついたとして、どこかの会社でそのデータをデータ分析とかに使用したりすることは違法になるのでしょうか?

②Instagramや価格コムなど、APIをもともと提供していたけど、終了したサイトがすごい多いんだな。と感じたのですが、APIを終了しているところは基本クローリング、スクレイピングしないでね。という意図があってなのでしょうか?

超超超初歩的な質問で大変恐縮なのですが(´;ω;`)、周りに聞ける人がいないので、どなかた教えていただけると大変うれしいです。

宜しくお願いします。

spoofy_dragon👍を押しています

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

m.ts10806

2020/04/03 13:48

>最終的にWebスクレイピングができるようになりたい プログラミングの最終目標がスクレイピングという時点で 「個人の責任で頑張って」となると思います。 それだけグレー(場合により黒)な部分が多い概念です。
pythonbegginer

2020/04/06 01:50

ありがとうございます。どうやらグレーな部分が多いようですね涙。 そこも含め色々勉強していきたいと思います。ありがとうございます。
guest

回答2

0

①ガイドラインがきちんとないサイトとかでも、例えば自分のスキルが後々ついたとして、どこかの会社でそのデータをデータ分析とかに使用したりすることは違法になるのでしょうか?

合法・違法の判断をここで質問するのは筋が悪いと思います。
ここは「プログラミングに関する質問」をする場所であって、法律のことは法律の専門家に相談しましょう。

専門家以外の素人が「合法だ」「違法だ」といくらいったところで、信じられる根拠が薄いです。
(法律・条例等を示しているならともかく)

②Instagramや食など、APIをもともと提供していたけど、終了したサイトがすごい多いんだな。と感じたのですが、APIを終了しているところは基本クローリング、スクレイピングしないでね。という意図があってなのでしょうか?

個別の事情はサービス提供元ごとに確認しないと知りようがありません。
むしろAPIを提供するというのは正規のデータ提供窓口を用意していることになるわけで、データを提供する意思があってスクレイピングを防ぎたいならAPIをやめることは無いんじゃないですかね。

投稿2020/04/03 10:12

gentaro

総合スコア8947

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

pythonbegginer

2020/04/06 01:46

丁寧な回答ありがとうございます。おっしゃる通りですね。 スクレイピングをできるように初めてみてわかったことがたくさんあり、使えたらすごく便利になることが多いと思っていましたがそれ以上にリスクが大きそうな気がします。 色々教えてくださり感謝です。ありがとうございます。
guest

0

法的な解釈は法律家に相談してください。

初学者の行うスクレイピングは、(スクレイピングする側もされる側も)百害あって一利もないです。
自身で運営しているサイトにスクレイピングされることもありましたが、最近はbotトラップを作るのを楽しんでいます。(ほいほい入っていくのを見るのはちょっと楽しいw)
スクレイピングする側は、壊れたデータを手に入れることになりますが、原因追求するのは無理だと思います。

参考:
4.面白そう!で学習教材(サンプルシステム)を選ぶな! - 「ググれ」って言われてググるな!【初学者べからず集 その1】

投稿2020/04/03 10:18

退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

pythonbegginer

2020/04/06 01:49

回答ありがとうございます。そうなんですね。 botトラップ!?そんなレベルが高い方にお答えいただき恐縮です。 スクレイピングを初めてから、初めてリスクのほうが多いということがわかりました。そこも含めプログラミング自体を頑張って勉強していきたいと思います。 ありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問