前提・実現したいこと
Google CloudのVisionAPIでOCRを使用したいが、出力する文字の種類をアルファベットと数字だけに制限したい
該当のソースコード
Python
1GOOGLE_CLOUD_VISION_API_URL = 'https://vision.googleapis.com/v1/images:annotate?key=' 2API_KEY = '******' 3 4# APIを呼び、認識結果をjson型で返す 5def request_cloud_vison_api(image_base64): 6 api_url = GOOGLE_CLOUD_VISION_API_URL + API_KEY 7 req_body = json.dumps({ 8 'requests': [{ 9 'image': { 10 # jsonに変換するためにstring型に変換する 11 'content': image_base64.decode('utf-8') 12 }, 13 'features': [{ 14 # ここを変更することで分析内容を変更できる 15 'type': 'TEXT_DETECTION', 16 'maxResults': 10, 17 }] 18 }] 19 }) 20 res = requests.post(api_url, data=req_body) 21 return res.json() 22 23# 画像読み込み 24def img_to_base64(filepath): 25 with open(filepath, 'rb') as img: 26 img_byte = img.read() 27 return base64.b64encode(img_byte) 28# 文字認識させたい画像を設定 29img_base64 = img_to_base64('./test.png') 30result = request_cloud_vison_api(img_base64) 31# 認識した文字を出力 32text_r = result["responses"][0]["textAnnotations"][1]["description"] 33print(text_r)
試したこと
ドキュメントを読みましたが該当の機能を見つけられませんでした
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。