前提・実現したいこと
【前提】
Google Cloud Platforms(GCP)のログをCloud storageにjsonファイルで吐き出しています。
Cloud storageのjsonファイルにはリンクURLが発行されhttp接続ができます。
リンクurlは以下のような感じです(一部修正してます)
https://storage.cloud.google.com/hoge/cloudfunctions.googleapis.com/cloud-functions/2020/05/25/hoge.json
ブラウザアクセスすると以下のようなURLにリダイレクト(?)され
https://00e9e6~44348b7-apidata.googleusercontent.com/download/storage/v1/b/hoge/o/cloudfunctions.googleapis.com%2Fcloud-functions%2F2020%2F05%2F25%~.json?qk=AD5~_gw&isca=1
画面には以下のように表示されます
{"insertId":"hogehoge","labels":{"execution_id":"hogehoge"},"logName":"hogehoge","receiveTimestamp":"2020-05-26T04:00:11.647179625Z","resource":{"labels":{"function_name":"hogehoge","project_id":"hogehoge","region":"hogehoge"},"type":"hogehoge"},"severity":"DEBUG","textPayload":"hogehoge","timestamp":"2020-05-26T04:00:00.390674062Z","trace":"hogehoge"}
これが何行も出てきていわゆるJsonLineの形式になってます。
【実現したいこと】
pythonにてjsonファイルを読み込みたい。
発生している問題・エラーメッセージ
以下のプログラムでjsonを読み込もうと思ったところ
python
1import requests 2 3url = "https://storage.cloud.google.com/hoge/cloudfunctions.googleapis.com/cloud-functions/2020/05/25/hoge.json" 4headers = {"content-type": "application/json"} 5r = requests.get(url, headers=headers) 6r.text
r.textで
'\n<!DOCTYPE html>\n<html lang="ja">\n <head>\n <meta charset="utf-8">\n <meta content="width=300, initial-scale=1" name="viewport">\n <meta name="google-site-verification" content="hoge">\n <title>ログイン - Google アカウント</title>\n<style>\n html, body {\n font-family: Arial, sans-serif;\n background: #fff;\n margin: 0;\n padding: 0;\n border: 0;\n position: absolute;\n height: 100%;\n min-width: 100%;\n font-size: 13px;\n color: ~
と表示され、ブラウザで見たものとは全く異なっていました。
これにより、r.json()などで読み込もうとしていたのが不可能になりました。
そもそもブラウザアクセス時にリダイレクト(?)されていたのが気になるのですが、どうしたら良いのか見当つかず、皆様のお知恵を拝借できればと思います。
あなたの回答
tips
プレビュー