Pythonで画像からデータの取得をしたい

・Pythonで自動化をしたい
・添付のような画像(給与ねっと)が例えば20枚など送られてきます

・下記記載の方法での修正のアイデアや、それ以外のアイデアなど
目的を達成できる気づきになるアドバイスがほしいです。

・画像からEXCELへそれぞれの項目の金額をまとめていきたい
・そのために、基本給が○○円、所得税が○○円、住民税が○○円と認識したい

やってみたこと

→表の中に手入力項目があるせいか、表として認識されないので
読み込みさえしてくれない

→文字などは高精度で読み込みでき、改行や空白で区切ってリストに格納することはできるのだが、
読み込みの順番？方向？が画像によってバラバラになるので、どの位置にどの項目の金額が指定できない

※例えば、'氏名'の次に必ず名前がくるとは限らない、
’氏名'という文字の読み込みがスズキの場合は先に読み込まれたり、佐藤の場合は後に読み込まれたりする。

このような状態なのですが、
なにか別のライブラリなど使ったほうが、などアドバイスもらえると嬉しいです。

行動規範の内容に同意します

回答1件

ベストアンサー

提示画像を見る限り、各項目の矩形のピクセル位置は固定のようなので

でいけそうだと思います。
2についてはPythonとOCRエンジンで画像から文字を認識するなどが参考になります。

投稿2022/09/04 06:00

総合スコア38262

2022/09/04 07:02

アドバイス、リンクまでありがとうございます。矩形を指定は頭になかったです。ありがとうございます。送られるスクリーンショットが少しずれたりがあるかもしれないのですが頂いた1−2の方法を調べてトライしてみます。

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問