🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
Google Cloud Platform

Google Cloud Platformは、Google社がクラウド上で提供しているサービス郡の総称です。エンドユーザー向けサービスと同様のインフラストラクチャーで運営されており、Webサイト開発から複雑なアプリ開発まで対応可能です。

Google API

Googleは多種多様なAPIを提供していて、その多くはウェブ開発者向けのAPIです。それらのAPIは消費者に人気なGoogleのサービス(Google Maps, Google Earth, AdSense, Adwords, Google Apps,YouTube等)に基づいています。

JSON

JSON(JavaScript Object Notation)は軽量なデータ記述言語の1つである。構文はJavaScriptをベースとしていますが、JavaScriptに限定されたものではなく、様々なソフトウェアやプログラミング言語間におけるデータの受け渡しが行えるように設計されています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

2回答

3505閲覧

Google Cloud Vision APIからのレスポンスがJsonフォーマットになってない

blackmanta

総合スコア7

Google Cloud Platform

Google Cloud Platformは、Google社がクラウド上で提供しているサービス郡の総称です。エンドユーザー向けサービスと同様のインフラストラクチャーで運営されており、Webサイト開発から複雑なアプリ開発まで対応可能です。

Google API

Googleは多種多様なAPIを提供していて、その多くはウェブ開発者向けのAPIです。それらのAPIは消費者に人気なGoogleのサービス(Google Maps, Google Earth, AdSense, Adwords, Google Apps,YouTube等)に基づいています。

JSON

JSON(JavaScript Object Notation)は軽量なデータ記述言語の1つである。構文はJavaScriptをベースとしていますが、JavaScriptに限定されたものではなく、様々なソフトウェアやプログラミング言語間におけるデータの受け渡しが行えるように設計されています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2019/12/12 06:56

前提・実現したいこと

サンプル画像を一つ用意して、Google Cloud Vision APIの光学式文字認識(OCR)をPythonで実装しようとしました。
ひとまずはレスポンスデータ全部を表示させて、最終的にはjson形式の、レスポンスデータの一部を取り出そうとしました。
(ソースコードには一部を取り出すなどの部分は、記載しておりませんが・・・)
具体的には、下記サンプル画像の認識を行いました。
イメージ説明

実行の参考サイトは下記になります。
リンク内容
上記のリンクのBasicフォルダにある、annotate_image_document_text_detection.pyファイルを参考に致しました。

事前に、pipのvenvで仮想環境の構築を行い、下記ライブラリのアップグレードを行い、左記環境化で実行致しました。
→google-cloud-vision/google-cloud-core/google-cloud-storage

また、pythonを実行する前に、きちんとGoogle Cloud Vision APIの認証情報を記載したJSONファイルへのパスをGOOGLE_APPLICATION_CREDENTIALSにセット致しました。

$ export GOOGLE_APPLICATION_CREDENTIALS=/path/to/my-credentials.json

発生している問題・エラーメッセージ

レスポンスが、jsonデータっぽいけど、カンマがないので、正式にはjsonデータではないようです。Google Cloud APIのドキュメントやページを見ても、正常であればjson形式でレスポンスを返すようです。レスポンスデータを下記に、添付致します。
**レスポンスが長すぎるので、途中部分は省略致します。
**

text_annotations { locale: "en" description: "The quick brown fox jumped over the lazy dogs.\n" bounding_poly { vertices { x: 44 y: 48 } vertices { x: 372 y: 48 } vertices { x: 372 y: 66 } vertices { x: 44 y: 66 } } } text_annotations { description: "The" bounding_poly { vertices { x: 44 y: 48 } vertices { x: 68 y: 48 } vertices { x: 68 y: 66 } vertices { x: 44 y: 66 } } } text_annotations { description: "quick" bounding_poly { vertices { x: 72 y: 48 } vertices { x: 105 y: 48 } vertices { x: 105 y: 66 } vertices { x: 72 y: 66 } } } text_annotations { description: "brown" bounding_poly { vertices { x: 115 y: 48 } vertices { x: 153 y: 48 } vertices { x: 153 y: 66 } vertices { x: 115 y: 66 } } } . . . words { property { detected_languages { language_code: "en" } } bounding_box { vertices { x: 368 y: 48 } vertices { x: 372 y: 48 } vertices { x: 372 y: 66 } vertices { x: 368 y: 66 } } symbols { property { detected_languages { language_code: "en" } detected_break { type: LINE_BREAK } } bounding_box { vertices { x: 368 y: 48 } vertices { x: 372 y: 48 } vertices { x: 372 y: 66 } vertices { x: 368 y: 66 } } text: "." confidence: 0.9700000286102295 } confidence: 0.9700000286102295 } confidence: 0.9700000286102295 } block_type: TEXT confidence: 0.9700000286102295 } } text: "The quick brown fox jumped over the lazy dogs.\n" }

該当のソースコード

python

1from google.cloud.vision import types 2from google.cloud import vision as vision 3import json 4 5image_dir = "../image_data" 6filename = str(image_dir + "/sample.jpg") 7client = vision.ImageAnnotatorClient() 8image = vision.types.Image() 9image.content = open(filename,'rb').read() 10 11request = types.AnnotateImageRequest(image = image , 12 features= [{'type': vision.enums.Feature.Type.DOCUMENT_TEXT_DETECTION}], 13 image_context = vision.types.ImageContext(language_hints = ['en'])) 14 15response_from_url = client.annotate_image(request) 16 17print(response_from_url)

試したこと

ソースコードの最後に、下記一文を追加してみましたが、jsonファイルでないことが確認できました。
→print("{}".format(json.dumps(response_from_url,indent=4)))

補足情報(FW/ツールのバージョンなど)

なぜJson形式でレスポンスが貰えないのかわかりません。
(Google側のバグなのでしょうか??、それとも私が間違っているのでしょうか??)
どうすればよいかわかりません。
どなたかご助言アドバイスよろしくお願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

サンプルコードを拝見すると

python

1client = vision.ImageAnnotatorClient() 2response_from_url = client.annotate_image(request)

クライアントライブラリを使用しているので、そのライブラリがAPIのレスポンス(=JSON?)をそのまま返却するのではなく、APIのレスポンスを解析して、 AnnotateImageResponse クラスに変換して返しているのではないでしょうか。

つまるところクライアントライブラリの仕様なのではないかと思います。

投稿2019/12/12 11:40

aaharu

総合スコア441

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

from google.protobuf.json_format import MessageToJson
を最初に記載して、下記を行うことで解決しました。
jsonObj = MessageToJson(request)
print(jsonObj)

投稿2019/12/17 07:59

blackmanta

総合スコア7

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問