CloudVisionを利用してOCRプログラムを作成しています。
画像データそのままを渡し、json型の結果を受け取ることはできるのですが、
2値化やモルフォロジー変換をさせた画像の結果を受け取るのがうまくいきません。
※元画像を加工し、保存したものを渡したらうまくいくでしょうが、保存せずに画像を渡す方法を模索しています。
単純に画像加工したデータを受け取り、base64型に変換したら、当然ながらエラーが発生して行き詰っています。
#下記エラーメッセージ
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte
加工したデータをどのように変換させれば、cloudvisionから結果を受け取れますか?
お詳しいかたご教示いただけますと幸いです。
python
1# -*- coding: utf-8 -*- 2import requests 3import base64 4import json 5import cv2 6import numpy as np 7 8GOOGLE_CLOUD_VISION_API_URL = 'https://vision.googleapis.com/v1/images:annotate?key=' 9API_KEY = ' "ここは鍵です"' 10 11# APIを呼び、認識結果をjson型で返す 12def request_cloud_vison_api(image_base64): 13 api_url = GOOGLE_CLOUD_VISION_API_URL + API_KEY 14 req_body = json.dumps({ 15 'requests': [{ 16 'image': { 17 # jsonに変換するためにstring型に変換する 18 'content': image_base64.decode('utf-8') 19 }, 20 'features': [{ 21 # ここを変更することで分析内容を変更できる 22 'type': 'TEXT_DETECTION', 23 'maxResults': 10, 24 }] 25 }] 26 }) 27 res = requests.post(api_url, data=req_body) 28 return res.json() 29 30# 画像読み込み 31def img_to_base64(filepath): 32 with open(filepath, 'rb') as img: 33 img_byte = img.read() 34 return base64.b64encode(img_byte) 35#画像加工 36def process(path): 37 img_or = imread(path) 38 # グレースケール化 39 img_gray = cv2.cvtColor(img_or, cv2.COLOR_RGB2GRAY) 40 # 2値化(100:2値化の閾値/画像を見て調整する) 41 ret, thresh1 = cv2.threshold(img_gray, 180, 255, cv2.THRESH_BINARY)#100,255 42 # ノイズ処理(モルフォロジー変換) 43 kernel = np.ones((0, 0), np.uint8) 44 img_opening = cv2.morphologyEx(thresh1, cv2.MORPH_OPEN, kernel) 45 46 return img_opening 47 48#日本語パス対策 49def imread(filename, flags=cv2.IMREAD_COLOR, dtype=np.uint8): 50 try: 51 n = np.fromfile(filename, dtype) 52 img = cv2.imdecode(n, flags) 53 return img 54 except Exception as e: 55 print(e) 56 return None 57 58# 文字認識させたい画像を設定 59path = r"C:\Users\ookura\Desktop\test\test.jpg" 60 61img_base64 = img_to_base64(process(path))#ここが不明 62result = request_cloud_vison_api(img_base64) 63# 認識した文字を出力 64 65 66text_r = result["responses"][0]["textAnnotations"][0]["boundingPoly"]["vertices"] 67print(text_r)
あなたの回答
tips
プレビュー