Google Cloud Vision APIからのレスポンスがJsonフォーマットになってない

前提・実現したいこと

サンプル画像を一つ用意して、Google Cloud Vision APIの光学式文字認識(OCR)をPythonで実装しようとしました。
ひとまずはレスポンスデータ全部を表示させて、最終的にはjson形式の、レスポンスデータの一部を取り出そうとしました。
(ソースコードには一部を取り出すなどの部分は、記載しておりませんが・・・)
具体的には、下記サンプル画像の認識を行いました。

実行の参考サイトは下記になります。
リンク内容
上記のリンクのBasicフォルダにある、annotate_image_document_text_detection.pyファイルを参考に致しました。

事前に、pipのvenvで仮想環境の構築を行い、下記ライブラリのアップグレードを行い、左記環境化で実行致しました。
→google-cloud-vision/google-cloud-core/google-cloud-storage

また、pythonを実行する前に、きちんとGoogle Cloud Vision APIの認証情報を記載したJSONファイルへのパスをGOOGLE_APPLICATION_CREDENTIALSにセット致しました。

$ export GOOGLE_APPLICATION_CREDENTIALS=/path/to/my-credentials.json

発生している問題・エラーメッセージ

レスポンスが、jsonデータっぽいけど、カンマがないので、正式にはjsonデータではないようです。Google Cloud APIのドキュメントやページを見ても、正常であればjson形式でレスポンスを返すようです。レスポンスデータを下記に、添付致します。
**レスポンスが長すぎるので、途中部分は省略致します。
**

text_annotations {
  locale: "en"
  description: "The quick brown fox jumped over the lazy dogs.\n"
  bounding_poly {
    vertices {
      x: 44
      y: 48
    }
    vertices {
      x: 372
      y: 48
    }
    vertices {
      x: 372
      y: 66
    }
    vertices {
      x: 44
      y: 66
    }
  }
}
text_annotations {
  description: "The"
  bounding_poly {
    vertices {
      x: 44
      y: 48
    }
    vertices {
      x: 68
      y: 48
    }
    vertices {
      x: 68
      y: 66
    }
    vertices {
      x: 44
      y: 66
    }
  }
}
text_annotations {
  description: "quick"
  bounding_poly {
    vertices {
      x: 72
      y: 48
    }
    vertices {
      x: 105
      y: 48
    }
    vertices {
      x: 105
      y: 66
    }
    vertices {
      x: 72
      y: 66
    }
  }
}
text_annotations {
  description: "brown"
  bounding_poly {
    vertices {
      x: 115
      y: 48
    }
    vertices {
      x: 153
      y: 48
    }
    vertices {
      x: 153
      y: 66
    }
    vertices {
      x: 115
      y: 66
    }
  }
}

.
.
.

words {
          property {
            detected_languages {
              language_code: "en"
            }
          }
          bounding_box {
            vertices {
              x: 368
              y: 48
            }
            vertices {
              x: 372
              y: 48
            }
            vertices {
              x: 372
              y: 66
            }
            vertices {
              x: 368
              y: 66
            }
          }
          symbols {
            property {
              detected_languages {
                language_code: "en"
              }
              detected_break {
                type: LINE_BREAK
              }
            }
            bounding_box {
              vertices {
                x: 368
                y: 48
              }
              vertices {
                x: 372
                y: 48
              }
              vertices {
                x: 372
                y: 66
              }
              vertices {
                x: 368
                y: 66
              }
            }
            text: "."
            confidence: 0.9700000286102295
          }
          confidence: 0.9700000286102295
        }
        confidence: 0.9700000286102295
      }
      block_type: TEXT
      confidence: 0.9700000286102295
    }
  }
  text: "The quick brown fox jumped over the lazy dogs.\n"
}

該当のソースコード

python
1from google.cloud.vision import types
2from google.cloud import vision as vision
3import json
4
5image_dir = "../image_data"
6filename = str(image_dir + "/sample.jpg")
7client = vision.ImageAnnotatorClient()
8image = vision.types.Image()
9image.content = open(filename,'rb').read()
10
11request = types.AnnotateImageRequest(image = image ,
12                features= [{'type': vision.enums.Feature.Type.DOCUMENT_TEXT_DETECTION}],
13                    image_context = vision.types.ImageContext(language_hints = ['en']))
14
15response_from_url = client.annotate_image(request)
16
17print(response_from_url)

試したこと

ソースコードの最後に、下記一文を追加してみましたが、jsonファイルでないことが確認できました。
→print("{}".format(json.dumps(response_from_url,indent=4)))

補足情報（FW/ツールのバージョンなど）

なぜJson形式でレスポンスが貰えないのかわかりません。
(Google側のバグなのでしょうか??、それとも私が間違っているのでしょうか??)
どうすればよいかわかりません。
どなたかご助言アドバイスよろしくお願い致します。

行動規範の内容に同意します

回答2件

ベストアンサー

サンプルコードを拝見すると

python
1client = vision.ImageAnnotatorClient()
2response_from_url = client.annotate_image(request)

クライアントライブラリを使用しているので、そのライブラリがAPIのレスポンス（＝JSON？）をそのまま返却するのではなく、APIのレスポンスを解析して、 AnnotateImageResponse クラスに変換して返しているのではないでしょうか。

つまるところクライアントライブラリの仕様なのではないかと思います。

投稿2019/12/12 11:40

aaharu

総合スコア441

from google.protobuf.json_format import MessageToJson
を最初に記載して、下記を行うことで解決しました。
jsonObj = MessageToJson(request)
print(jsonObj)

投稿2019/12/17 07:59

blackmanta

総合スコア7

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.47%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！