PCスペック
Windows10 HOME 64bit
メモリ 32GB
プロセッサ Intel Core i7-8700CPU 3.20GHz
Android Studio 3.4.1(最新ver)
デモ用端末(XPERIA OS:7.0 API 24)
Google Cloud Vision APIを用いて、文字認識を行っています。
現在、DOCUMENT_TEXT_DETECTIONを用いて、
撮影した画像に写っている文字を抽出できています。
その検出方法なのですが、下の例を参考にしてみると、
logcatで、読み取れた部分のlabelを確認してみた際に、以下のような形式で読み取っており、一文字ずつ解析した結果、一番最後尾の"text":"MONO\n"で、読み取れたテキストが「MONO」であったということがわかります。
{"pages":[{"blocks":[{"blockType":"TEXT","boundingBox":{"vertices":[{"x":210,"y":514},{"x":524,"y":514},{"x":524,"y":576},{"x":210,"y":576}]},"confidence":0.9900000095367432,"paragraphs":[{"boundingBox":{"vertices":[{"x":210,"y":514},{"x":524,"y":514},{"x":524,"y":576},{"x":210,"y":576}]},"confidence":0.9900000095367432,"words":[{"boundingBox":{"vertices":[{"x":210,"y":514},{"x":524,"y":514},{"x":524,"y":576},{"x":210,"y":576}]},"confidence":0.9900000095367432,"symbols":[{"boundingBox":{"vertices":[{"x":210,"y":514},{"x":281,"y":514},{"x":281,"y":576},{"x":210,"y":576}]},"confidence":0.9900000095367432,"text":"M"},{"boundingBox":{"vertices":[{"x":301,"y":514},{"x":367,"y":514},{"x":367,"y":576},{"x":301,"y":576}]},"confidence":0.9900000095367432,"text":"O"},{"boundingBox":{"vertices":[{"x":378,"y":514},{"x":441,"y":514},{"x":441,"y":576},{"x":378,"y":576}]},"confidence":0.9900000095367432,"text":"N"},{"boundingBox":{"vertices":[{"x":458,"y":514},{"x":524,"y":514},{"x":524,"y":576},{"x":458,"y":576}]},"confidence":0.9900000095367432,"property":{"detectedBreak":{"type":"LINE_BREAK"}},"text":"O"}]}]}]}],"height":1200,"width":760}],"text":"MONO\n"}
問題点
text「MONO」の後に「\n」が付随しているのが不都合であり、はずしたいと思っています。
「"text":"MONO\n"」ではなく、「"text":"MONO"」にすることは可能なのでしょうか。
回答1件
あなたの回答
tips
プレビュー