質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Instagram API

Instagram APIは、写真共有SNSであるInstagramの投稿写真をWebサイトに掲載するためのAPIです。取得することでWebサイトと連携し、自動的に投稿写真を表示することができます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

2回答

12916閲覧

指定したInstagramユーザーの全画像をスクレイピングしたい

grmn

総合スコア13

Instagram API

Instagram APIは、写真共有SNSであるInstagramの投稿写真をWebサイトに掲載するためのAPIです。取得することでWebサイトと連携し、自動的に投稿写真を表示することができます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2017/03/24 07:44

現状

こちらのコードでローカルに画像を12枚まで保存できます

Python

1import os 2from urllib.request import urlopen 3from selenium import webdriver 4from bs4 import BeautifulSoup 5 6URL = "https://www.instagram.com/rolaofficial/" 7 8driver = webdriver.PhantomJS() 9driver.get(URL) 10html = driver.page_source 11 12bs = BeautifulSoup(html, "html.parser") 13img_urls = [img.get("src") for img in bs.select("._myci9 img")] 14 15# 保存 16img_dir = "images" 17if not os.path.exists(img_dir): 18 os.mkdir(img_dir) 19 20for i,url in enumerate(img_urls): 21 print(url) 22 with urlopen(url) as res: 23 img = res.read() 24 with open(img_dir + "/photo%d.jpg" % (i+1), "wb") as f: 25 f.write(img)

目的

入力したユーザーIDの画像を'すべて'取得したいです

イメージ説明

  • デフォルトで画像を12枚までしか表示していない
  • サイト下部にある「さらに表示」ボタンを押すと無限スクロールが開始する

といったサイトのすべての画像をスクレイピングするにはどうすればよいでしょうか?

もしくは、これはPythonでは実現できないのでしょうか?

ご教授お願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

そもそも、Instagramをスクレイピングすることは禁止されています(利用規約)。

Instagramは、自動装置などを使って本サービス上のあらゆるコンテンツ(利用者のプロフィールや写真を含みますが、これに限定されません)を巡回、収集、キャッシングしたり、これにアクセスしたりすることを禁止しています(ただし、標準的な検索エンジンプロトコルまたはInstagramが明示的に認めている検索エンジンが使用する技術を用いる場合を除きます)。

投稿2017/03/24 08:03

maisumakun

総合スコア145183

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

1年以上前の質問への突然の回答すみません...こちらの回答はインスタグラムの規約改正?がされたかを私自身が確認したく投稿しているものです。

本題について(もう自己解決されているかもですが)

まだ規約改正により禁止事項ではなくなったという確信がないので、とりあえず私がとった方法をヒントという形で挙げます。(色々な方法があると思われるので1例です。)

  1. 1枚目の写真をクリック(実際にやってみると背景にフェードがかかり写真が拡大表示されます。)
  2. coreSpriteRightPaginationArrowというクラスを持った矢印の要素があるのでこれをクリック
  3. 順次写真を取ることができます。(取ったらまた矢印をクリック...以下最後まで)

Waitを適宜入れるのがコツです。

規約改正について

1年前には禁止事項であったことは私も確認していたのですが、先ほどページを見たところ該当部分を発見することができませんでした。

もしかしたら現在は禁止事項ではなくなったのかもしれません。(証拠には全くなりませんが、instagramのスクレイピングに関する記事がQiitaでもいくつか確認できます。)
何かご存知の方がいらっしゃればコメントいただけると幸いです。よろしくお願いします。m(_ _)m

追記

コメント欄にある通り2018年9月1日現在も禁止のようです。お騒がせいたしました。m(_ _)m

投稿2018/08/31 19:43

編集2018/08/31 22:29
namnium1125

総合スコア2043

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

maisumakun

2018/08/31 22:18

現在の規約にも、 「不正な方法を用いて、アカウントの作成、情報へのアクセス、または情報の取得を試みることは禁止されています。 これには、弊社から明示的な許可を得ることなく、自動化された手段を用いてアカウントを作成したり、情報を取得したりする行為が含まれます。」 というのが入っていて、スクレイピングは禁止されているようです。
namnium1125

2018/08/31 22:27

あ、本当ですね...ありがとうございます。m(_ _)m 流し読みしたときには自動化によるアカウントの作成だけが禁止になったのかと勘違いしてしまいました(都合のよい解釈をしてしまったようです)。「情報の取得」もダメみたいですね...(;´∀`)
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問