リクエストで返ってきたデータをExcelに出力する際に、辞書型からリスト型に変更したいです。

Question

現在、Instagram投稿写真を収集するため、下記サイトを参考にしています。
https://gaaaon.jp/blog/instagram

収集したデータをExcelに書き出した際に、メディアタイプがIMAGE（投稿写真１枚）の場合は、media_urlの列に画像URLが表示されるのですが、複数枚投稿の際はchildren.dataの列内にそれぞれの写真idとURL（'id': '-----', 'media_url': 'https://-'：画像赤文字部分）が含まれた形で表示されてしまいます。

この複数枚投稿の際も、１枚投稿写真の時の様に’https://-’のみだけがExcelに出力できるようにしたいのですがどの様にすればよいのか分からず、質問させていただきました。

この１ヶ月でPythonを触り始めたばかりですので、まだまだプログラミングに関して理解が足りていません。
具体的なコードの変更等アドバイスをいただきたいです。

下記に、現在Jupiter notebookに書いているコードを載せています。

![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2022-06-22/32eb0c73-26ee-4299-9147-de6b625425d9.png)

```ここに言語を入力
import requests
import pandas as pd
import json

# あらかじめID等は取得しておく
instragramID = "instragramID"
ACCESS_TOKEN = "ACCESS_TOKEN"

# 検索したいワード
query = "マキアート"

id_search_url = "https://graph.facebook.com/ig_hashtag_search?user_id=" + instragramID + "&q=" + query +  "&access_token=" + ACCESS_TOKEN

response = requests.get(id_search_url)
hash_id = response.json()
print(hash_id)

# 検索タイプを選択
serch_type = "top_media"

url = "https://graph.facebook.com/" + "17843767135051777" + "/" + serch_type + "?user_id=" + instragramID + "&q=" + query + "&access_token=" + ACCESS_TOKEN + "&fields=id,media_type,media_url,permalink,like_count,comments_count,caption,timestamp,children{id,media_url}&limit=50"

response = requests.get(url)
json_data = response.json()

for i in range(50):
   print(json_data["data"][i])

print (json_data["paging"])

info = json_data
df2 = pd.json_normalize(info['data'])
df2.to_csv(r"sample02.csv",encoding='utf-8-sig')

for a in range(3):
    url=json_data["paging"]["next"]
    response = requests.get(url)
    json_data = response.json()

＃50件を見やすくするために
    print("======================================")
    print("======================================")
    print("======================================")
    print("======================================")
    print("======================================")

for i in range(50):
        print(json_data["data"][i])
        print (json_data["paging"])
        
    info = json_data
    df2 = pd.json_normalize(info['data'])
    print(df2)
    df2.to_csv(r"sample02.csv", mode = 'a',encoding='utf-8-sig')  
```

【追記】

複数の画像URLをchildren列で取得した際に、画像の様に一つずつ画像URLのみをmedia_url列に入れたいです。

![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2022-06-22/b93565ec-fb87-4a97-aeca-b15df455761d.png)

for a in range(3):
以降は、51件目以降を50件ずつ、3回取得するように書いているつもりです。
現在のコードでは、最初の50件を含め、51-100件目、101-150件目、151-200件目、合計200件の投稿を取得出来るようにしています。

Accepted Answer

APIのレスポンス内容および最終的に欲しい結果の構造をちゃんと把握できていませんが、以下のように`children`の有無でデータを整形すればよさそうです。

参考：[Instagram Graph APIメモ](https://qiita.com/ricemountainer/items/70e96f14715633fb9966)
```Python
import pandas as pd

# テストデータ
json_data = {
    "data": [
        {
            "id": "111",
            "media_type": "IMAGE",
            "media_url": "https://111",
        },
        {
            "id": "222",
            "media_type": "CAROUSEL_ALBUM",
            "children": {
                "data": [
                    {
                        "id": "222111",
                        "media_url": "https://222111",
                    },
                    {
                        "id": "222222",
                        "media_url": "https://222222",
                    }
                ]
            },
        }
   ]
}
#json_data = response.json()

# childrenの有無でデータを整形
datas = []
for m in json_data['data']:
    if 'children' in m: # CAROUSEL_ALBUM など？
        datas += m['children']['data'] # 子供を追加
    else: # IMAGE など？
        datas.append(m) # 自身を追加

df2 = pd.json_normalize(datas)
print(df2)
#       id media_type       media_url
#0     111      IMAGE     https://111
#1  222111        NaN  https://222111
#2  222222        NaN  https://222222
```

関連した質問