質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Beautiful Soup

Beautiful Soupは、Pythonのライブラリの一つ。スクレイピングに特化しています。HTMLデータの構文の解析を行うために、HTMLタグ/CSSのセレクタで抽出する部分を指定することが可能です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

Q&A

解決済

2回答

2410閲覧

スクレイピング可能かどうか

yy-_.15

総合スコア17

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Beautiful Soup

Beautiful Soupは、Pythonのライブラリの一つ。スクレイピングに特化しています。HTMLデータの構文の解析を行うために、HTMLタグ/CSSのセレクタで抽出する部分を指定することが可能です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

0グッド

2クリップ

投稿2020/10/29 02:46

編集2020/10/29 02:49

あるサイトの利用規約について

第7条 禁止行為

  1. 登録ユーザーは、本サービスの利用にあたり、以下の各号のいずれかに該当する行為をしてはなりません。

(1)当社、又は他の登録ユーザーその他の第三者の知的財産権、肖像権、プライバシーの権利、名誉、その他の権利又は利益を侵害する行為(かかる侵害を直接又は間接に惹起する行為を含みます。)
(2)製品表示、著作権表示その他の表示を削除又は変更する行為
(3)購入したコンテンツについて複製、頒布、公衆送信、改変、翻訳、翻案又は二次的著作物の作成をする行為

この(3)においてスクレイピングは複製に当たると思うのですが、
著作権法第30条によると私的使用の為の複製は可能と書かれてあります。

Amazonのように利用規約にデータ収集・抽出ツールの利用は禁止と明示されているわけではありませんが、
上記サイト第7条(3)にように書かれていればスクレイピングは法律違反行為でしょうか?

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

ockeghem

2020/10/29 02:50

購入した(有料の)コンテンツをスクレイピングするという前提で問題ないですか?
yy-_.15

2020/10/29 02:55 編集

いえ、無料のコンテンツを私的利用で複製するという形です。
gentaro

2020/10/29 02:55

法律相談は「プログラミングに関する質問」じゃないんでこのサイトで聞くのが間違い。
ockeghem

2020/10/29 02:56

第7条(3)は「購入したコンテンツについて」と明示されているので、無料のコンテンツについては該当しないと思います
yy-_.15

2020/10/29 02:57

申し訳ありません。teratailではこのような質問は禁止でしょうか?
yy-_.15

2020/10/29 02:59

つまり”購入したコンテンツについて” という文がなければ無料コンテンツでも違法となりえましょうか?
ockeghem

2020/10/29 03:00

プログラミングには関連しているので、広くとらえれば禁止とまではいえないけど、法律上大丈夫かどうかはの判断は弁護士にしかできない、ということだと思います
y_waiwai

2020/10/29 03:00

低評価対象、ですね
hentaiman

2020/10/29 03:07

仮にここでたぶん大丈夫ですよ~って回答らしきものを貰えたとして、実行した結果訴訟される事態になった時にどうするつもりなんでしょう?
yy-_.15

2020/10/29 03:08

法律関係の質問は控えるべきと言うことですね。 申し訳ありません。承知致しました。
hentaiman

2020/10/29 03:11

作る側として、システムに絡めての質問だったらまあアリかとも思います。 ただそんな重要な事をQAで済ませる神経は疑いますが。
yy-_.15

2020/10/29 03:13

その通りですね。 法律の専門家に相談すべき事項でした。
nto

2020/10/29 03:31

既に解決済みとなっている様ですが とりあえず質問内容については 違法行為であるかどうか→違法ではない 規約に違反しているかどうか→それは購入したコンテンツについての規約である為、無料コンテンツに対する規約ではない為その項目上では違反には該当していない 以上となります。 先日のページの件だとは思いますが、同時に「その他、当社か゛不適切と判断する行為」といった規約も定義されており、ケースバイケースでこちらが適用される場合はあり得るとおもいます。 どういった場合に~という点についてはockeghem様の回答が非常に参考になると思います。
yy-_.15

2020/10/29 03:57

先日に引き続き、ご回答ありがとうございます。 初心者ですので、慎重な行動、しっかりした勉強を心がけたいと思います。
guest

回答2

0

ベストアンサー

一般的にスクレイピングそのものは違法ではありません。ウェブサイトをアクセスするツールを総称してユーザーエージェントと呼びますが、どのようなユーザーエージェントを使うかは利用者の自由であり、Google Chromeの代わりにwgetやcurlを使ってもよいわけです。そして、それを自動化するとスクレイピングになります。スクレイピング自体はインターネット利用の歴史とともに広く行われてきた行為であり、スクレイピングの教科書も多数あります。それ自体は違法ではありません。

一方で、スクレイピングによってアクセス先に迷惑をかけてしまうことも往々にしてあります。俗に「お行が悪い」と称されるものです。それは推奨されないことであり、スクレイピングをやるには慎重さが必要になります。慎重にやったつもりでも、プログラム作成の技量が低かったり、テストが不十分だったりすると、意図せずお行儀の悪いプログラムになることは十分ありえます。

また、アクセス先のサイトの問題で、「お行が悪くない」スクリプトなのに、アクセス先サイトがダウンしてしまうこともあります。そして、スクレイピングを行った側が逮捕されるという事件がありました。以下を参照下さい。

岡崎市立中央図書館事件 - Wikipedia

すなわち、スクレイピングは法律で禁止されてはいませんが、状況によってはサイトに負荷を過度にかけたり、サイトがダウンしたり、最悪ケースで逮捕者が出た…ということを踏まえれば、質問サイトで質問されたら、「まぁやめておきなさい」となるのだろうと思います。

投稿2020/10/29 03:18

ockeghem

総合スコア11705

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

yy-_.15

2020/10/29 03:22

なるほど、これら事項について詳しく勉強したいと思います。 詳しいご回答をありがとうございます。
guest

0

法律違反、ではないでしょうけど、そのサイトの規約違反、となります。
まあ、スクレイピングによってそのサイトが落ちたり動作不良になったりすると、損害を与えたとして刑事捜査対象となったりしますね

投稿2020/10/29 03:02

y_waiwai

総合スコア88042

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

yy-_.15

2020/10/29 03:07

なるほど、では大半のサイトが利用規約に複製を禁ずると書かれていることが多いので、 スクレイピングをすると基本規約違反をしていると認識した方が良いでしょうか?
y_waiwai

2020/10/29 03:09

そういうことですね。 それによって何らかの報復をされたとしてもしようがないってことになります
yy-_.15

2020/10/29 03:12

ありがとうございます。 理解ができました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問