###目的
請求書がどの会社からのものか、分類することが目的です。
OCRなどで請求書にある会社名は、日本の請求書は大抵が社判と
重なっているために、読み込めないケースが大半でした。
画像として分類して、類似したものですから、分類できないものか?
と考えています。
毎月の請求書スキャン画像の差異は、日付と請求額以外はほぼ同じ、
明細行数が違う場合があるのが、一番の差になりそうです。
定期的な請求が大半で大量なので、
データ化して入力を省力化できないものかと。
以下、質問です。
###(質問1)参考になりそうな書籍はありますか?
画像の分類は、機械学習になるのかと思いますが、
おすすめの書籍などがあれば教えてください。
そもそも方法が違うよ、こんな方法で実現できる、
というご指摘も歓迎です。
###(質問2)どの程度の難易度でしょうか?
画像の分類はそこまで難易度が高くなく、サンプルもWeb上に
動かせるものがありそうかと、甘い考えでした。
実際はじっくり学習しないとハードル高いよ、ということでしたら、
その点もご指摘ください。
####私の経験など、いまできること
あまり関係ないかもしれまんせが、一応。
機械学習については、ネット記事を読んだりくらいで、
基礎知識が不足しています。
主は業務でやっているWindows Formのシステム開発です。
言語:VB.net(Visual Studio2005)
DB:MS SQL Server2005
趣味プログラムなどで。
言語:PHP、Ruby(on Rails)、HTML・CSS
会社・自宅のパソコンともにWindows環境です。
LinuxなどはAWSでやっています。
よろしくお願いいたします。
以上です。