質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Google Cloud Platform

Google Cloud Platformは、Google社がクラウド上で提供しているサービス郡の総称です。エンドユーザー向けサービスと同様のインフラストラクチャーで運営されており、Webサイト開発から複雑なアプリ開発まで対応可能です。

Google API

Googleは多種多様なAPIを提供していて、その多くはウェブ開発者向けのAPIです。それらのAPIは消費者に人気なGoogleのサービス(Google Maps, Google Earth, AdSense, Adwords, Google Apps,YouTube等)に基づいています。

API

APIはApplication Programming Interfaceの略です。APIはプログラムにリクエストされるサービスがどのように動作するかを、デベロッパーが定めたものです。

Q&A

解決済

1回答

2672閲覧

【雑談レベル】Google Cloud Vision APIでOCR処理をしてデータベース化をやってみようかな・・・(;^_^A

TakefusaBoku

総合スコア41

Google Cloud Platform

Google Cloud Platformは、Google社がクラウド上で提供しているサービス郡の総称です。エンドユーザー向けサービスと同様のインフラストラクチャーで運営されており、Webサイト開発から複雑なアプリ開発まで対応可能です。

Google API

Googleは多種多様なAPIを提供していて、その多くはウェブ開発者向けのAPIです。それらのAPIは消費者に人気なGoogleのサービス(Google Maps, Google Earth, AdSense, Adwords, Google Apps,YouTube等)に基づいています。

API

APIはApplication Programming Interfaceの略です。APIはプログラムにリクエストされるサービスがどのように動作するかを、デベロッパーが定めたものです。

0グッド

1クリップ

投稿2017/01/22 04:57

今、仕事で昔の紙伝票を電子化&データベース化するというミッションがあります。
単純にアルバイトでも臨時で雇って電子化と入力作業をお願いするという手段とかも考えられますが、芸がないのと社内の雰囲気としても技術的挑戦は許されるので少し考えている最中です。(あまり大型投資は許されませんが・・・)

いろいろと調べていますが、あまり文献がなかったのでここに書いてみた次第です。雑談レベルでヒントを頂けるとすごく嬉しいです。

調べていく中で、Google Cloud Vision APIはなかなかの画像認識レベルということがわかりました。
これを使えばデータの抽出はかなりいい感じにいけるのではないかと思っています。

しかし、ここで課題があるのですが紙伝票のデータ内容はほぼほぼ似た感じであるのですがフォーマットが100種類??くらい存在しているという問題があります(´;ω;`)ウゥゥ
同一フォーマットであれば抽出されたX行目のデータをデータベースのどのフィールドに投げ込みという処理をしてあげればいいと思うのですがさすがにフォーマットがバラバラだと難しいですよね。
AIとかで自動認識してデータをある程度整形してくれないかななんて冗談を考えつつどのような仕組みがいいのか悩んでいます。

このような構成をもとにした場合、皆さんであればどのように解決されていきますか?
よろしくお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2017/01/24 05:09

頑張れ!(^∀^)ノ
guest

回答1

0

ベストアンサー

課題としては以下のような感じでしょうか。
1)電子化
ここで、斜めになったり歪みが出ると、そのあとの工程に影響が出てきます。
2)100種の伝票それぞれを認識して処理を分ける必要があるのか、ほぼ同位置に存在する情報を利用するのか
画像認識の精度が良くなったとしても、各々のフォーマットに対して、画像として特徴量が少なかったり、同じような特徴しか取れない場合、学習しても精度が上がらない可能性が高いです。
前者であれば、前処理を行い、不要部分を取り除いた上でOCR(Google Cloud Vision)に投げるということも可能になりそう
後者の場合、やってみないとどこまでの精度が上がるか判断が難しい
3)学習コスト
ともかく、100種類のフォーマットを認識しなければならないとすれば、それなりのデータを分類器にかけてみて、うまく分類できるか確認したり、教師ありデータを作成して、学習してみたりするトライアンドエラーが必要になります。
これはそれなりにリソースが必要となりそう。

まずは前者をやってみて、どんな感じになるかみてみるかな、分類されないのであれば、逆に2の前者が期待できそうだし、そうでないなら、教師ありデータで頑張るか、2の前者とハイブリッドでなどの検討材料になるかと思います。

投稿2017/01/26 02:18

t_obara

総合スコア5488

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

TakefusaBoku

2017/02/02 15:29

回答いただいていたにも関わらず返答が遅くなり申し訳ございません。 そうですよね。各工程においてもそれなりのリソースを要するということですよね。 様々な角度から検討してみたいと思います。 ありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問