スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。
Beautiful Soupは、Pythonのライブラリの一つ。スクレイピングに特化しています。HTMLデータの構文の解析を行うために、HTMLタグ/CSSのセレクタで抽出する部分を指定することが可能です。
リモートシステムからローカルシステムへとデータを受信する事、もしくはそのようなデータ転送を行う事をダウンロードと呼びます。
Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。
Q&A
解決済
1回答
823閲覧
総合スコア7
0グッド
0クリップ
投稿2019/12/14 04:23
0
### 調べましたがわかりませんでした。
どなたかおしえください。
気になる質問をクリップする
クリップした質問は、後からいつでもMYページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
質問へのコメント
回答1件
ベストアンサー
スクレイピングで画像DLは違法とみなされる可能性があるみたいですよ。
根拠: スクレイピングは違法?3つの法律問題と対応策を弁護士が5分で解説
根拠として提示したサイトでは、
「情報解析を目的とした記録または翻案」
等のようなものだけが合法とされています。
なので厳しいと思います。
技術的には出来ても、法で禁止されているのならそれは「出来ない」のと同義です。
よって、不可能かと。
(一応私もやろうとした時期がありましたが、上記を知って辞めましたし。)
投稿2019/12/14 05:36
総合スコア4962
あなたの回答
tips
太字
斜体
打ち消し線
見出し
引用テキストの挿入
コードの挿入
リンクの挿入
リストの挿入
番号リストの挿入
表の挿入
水平線の挿入
プレビュー
15分調べてもわからないことはteratailで質問しよう!
ただいまの回答率85.36%
質問をまとめることで思考を整理して素早く解決
テンプレート機能で簡単に質問をまとめる
スクレイピングの方法を
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。