質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
OpenCV

OpenCV(オープンソースコンピュータービジョン)は、1999年にインテルが開発・公開したオープンソースのコンピュータビジョン向けのクロスプラットフォームライブラリです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

0回答

457閲覧

Cloudvision apiでOCRするリクエスト画像を加工してから送信したい

ookura

総合スコア27

OpenCV

OpenCV(オープンソースコンピュータービジョン)は、1999年にインテルが開発・公開したオープンソースのコンピュータビジョン向けのクロスプラットフォームライブラリです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/12/02 06:54

編集2020/12/02 14:24

CloudVisionを利用してOCRプログラムを作成しています。
画像データそのままを渡し、json型の結果を受け取ることはできるのですが、
2値化やモルフォロジー変換をさせた画像の結果を受け取るのがうまくいきません。
※元画像を加工し、保存したものを渡したらうまくいくでしょうが、保存せずに画像を渡す方法を模索しています。

単純に画像加工したデータを受け取り、base64型に変換したら、当然ながらエラーが発生して行き詰っています。

#下記エラーメッセージ
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte

加工したデータをどのように変換させれば、cloudvisionから結果を受け取れますか?
お詳しいかたご教示いただけますと幸いです。

python

1# -*- coding: utf-8 -*- 2import requests 3import base64 4import json 5import cv2 6import numpy as np 7 8GOOGLE_CLOUD_VISION_API_URL = 'https://vision.googleapis.com/v1/images:annotate?key=' 9API_KEY = ' "ここは鍵です"' 10 11# APIを呼び、認識結果をjson型で返す 12def request_cloud_vison_api(image_base64): 13 api_url = GOOGLE_CLOUD_VISION_API_URL + API_KEY 14 req_body = json.dumps({ 15 'requests': [{ 16 'image': { 17 # jsonに変換するためにstring型に変換する 18 'content': image_base64.decode('utf-8') 19 }, 20 'features': [{ 21 # ここを変更することで分析内容を変更できる 22 'type': 'TEXT_DETECTION', 23 'maxResults': 10, 24 }] 25 }] 26 }) 27 res = requests.post(api_url, data=req_body) 28 return res.json() 29 30# 画像読み込み 31def img_to_base64(filepath): 32 with open(filepath, 'rb') as img: 33 img_byte = img.read() 34 return base64.b64encode(img_byte) 35#画像加工 36def process(path): 37 img_or = imread(path) 38 # グレースケール化 39 img_gray = cv2.cvtColor(img_or, cv2.COLOR_RGB2GRAY) 40 # 2値化(100:2値化の閾値/画像を見て調整する) 41 ret, thresh1 = cv2.threshold(img_gray, 180, 255, cv2.THRESH_BINARY)#100,255 42 # ノイズ処理(モルフォロジー変換) 43 kernel = np.ones((0, 0), np.uint8) 44 img_opening = cv2.morphologyEx(thresh1, cv2.MORPH_OPEN, kernel) 45 46 return img_opening 47 48#日本語パス対策 49def imread(filename, flags=cv2.IMREAD_COLOR, dtype=np.uint8): 50 try: 51 n = np.fromfile(filename, dtype) 52 img = cv2.imdecode(n, flags) 53 return img 54 except Exception as e: 55 print(e) 56 return None 57 58# 文字認識させたい画像を設定 59path = r"C:\Users\ookura\Desktop\test\test.jpg" 60 61img_base64 = img_to_base64(process(path))#ここが不明 62result = request_cloud_vison_api(img_base64) 63# 認識した文字を出力 64 65 66text_r = result["responses"][0]["textAnnotations"][0]["boundingPoly"]["vertices"] 67print(text_r)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問