回答編集履歴
4
フォーマットの修正
test
CHANGED
@@ -74,13 +74,15 @@
|
|
74
74
|
|
75
75
|
- カード左下領域の情報を使う(左下にある四角部分をマーカーに使う):汎用性低
|
76
76
|
|
77
|
-
- 画像として認識させる:お勧めしません(先の画像認識の下りの部分を参照ください)が、深層学習で対応するのであれば、データ増強の際に画像をゴリゴリ回転させたり反転させたりすることで対応できます
|
77
|
+
- 画像として認識させる:お勧めしません(先の画像認識の下りの部分を参照ください)が、深層学習で対応するのであれば、データ増強の際に画像をゴリゴリ回転させたり反転させたりすることで対応できます。
|
78
78
|
|
79
79
|
|
80
80
|
|
81
81
|
**照明の照りこみが激しい?)**
|
82
82
|
|
83
83
|
鏡面反射分が多いと画像処理(緑色領域の抽出、OCR精度)で不利になります。照りこみが減るような工夫(すりガラスのような濁ったものを証明の前に挟む、直接照らさずに、白い紙のようなものに一度反射させて間接照明にする、のような工夫をすることでだいぶ良くなると思います。
|
84
|
+
|
85
|
+
|
84
86
|
|
85
87
|
---
|
86
88
|
|
3
追補2(照明)
test
CHANGED
File without changes
|
2
追補2(照明)
test
CHANGED
@@ -78,6 +78,10 @@
|
|
78
78
|
|
79
79
|
|
80
80
|
|
81
|
+
**照明の照りこみが激しい?)**
|
82
|
+
|
83
|
+
鏡面反射分が多いと画像処理(緑色領域の抽出、OCR精度)で不利になります。照りこみが減るような工夫(すりガラスのような濁ったものを証明の前に挟む、直接照らさずに、白い紙のようなものに一度反射させて間接照明にする、のような工夫をすることでだいぶ良くなると思います。
|
84
|
+
|
81
85
|
---
|
82
86
|
|
83
87
|
もし私がやるのであれば、
|
1
追補
test
CHANGED
@@ -1,4 +1,14 @@
|
|
1
1
|
情報を補足するような質問を書きましたが、暫定での解決策を書きます。
|
2
|
+
|
3
|
+
|
4
|
+
|
5
|
+
**修正1)**
|
6
|
+
|
7
|
+
質問欄の2点を反映させます。
|
8
|
+
|
9
|
+
- Q1 とりあえず百人一首のトイプロブレムが解ければOK
|
10
|
+
|
11
|
+
- Q2 基本は真上だけれども180°回転も可能なら対応したい
|
2
12
|
|
3
13
|
|
4
14
|
|
@@ -8,7 +18,7 @@
|
|
8
18
|
|
9
19
|
**文字の認識面)**
|
10
20
|
|
11
|
-
恐らく、百人一首のフォントが通常のフォント(明朝・ゴシック)から離れている(行書寄り?)なことが一因だと
|
21
|
+
恐らく、百人一首のフォントが通常のフォント(明朝・ゴシック)から離れている(行書寄り?)なことが一因だと思います。OCRで攻めるのであれば、百人一首の文字は全てひらがななので、[ひらがなで自前データセットを作る](https://www.tdi.co.jp/miso/tesseract-ocr)のもありだと思います。
|
12
22
|
|
13
23
|
|
14
24
|
|
@@ -32,7 +42,7 @@
|
|
32
42
|
|
33
43
|
|
34
44
|
|
35
|
-
深層学習を使って物体認識(セマンティックセグメンテーションだとかインスタンスセグメンテーションと呼びます)することもできますが、それができるのであれば直接100クラスの画像認識問題にした方が筋が良さそうですね…
|
45
|
+
深層学習を使って物体認識(セマンティックセグメンテーションだとかインスタンスセグメンテーションと呼びます)することもできますが、それができるのであれば直接100クラスの画像認識問題にした方が筋が良さそうですね…
|
36
46
|
|
37
47
|
|
38
48
|
|
@@ -42,9 +52,29 @@
|
|
42
52
|
|
43
53
|
|
44
54
|
|
55
|
+
---
|
56
|
+
|
57
|
+
|
58
|
+
|
45
|
-
**文字列の認識精度)**
|
59
|
+
**文字列としての認識精度)**
|
46
60
|
|
47
61
|
OCRで解決しようとした場合、仮に独自データセットを作ったとしても「しるもしらぬもあふさかのせき」が「しろもしらめもあふきかのせさ」として認識されることもあるかと思います。こういった場合には、[文字列全体の一致度をデータベースの中身と比較](https://docs.python.org/ja/3/library/difflib.html)させると精度が挙げられそうですね。
|
62
|
+
|
63
|
+
|
64
|
+
|
65
|
+
---
|
66
|
+
|
67
|
+
|
68
|
+
|
69
|
+
**上下反転してもいける?)**
|
70
|
+
|
71
|
+
やり方は3種類あると思います。
|
72
|
+
|
73
|
+
- OCRする際に、画像をそのままのものと反転させたものを突っ込み、最後の文章としての認識具合をチェック:恐らく正攻法
|
74
|
+
|
75
|
+
- カード左下領域の情報を使う(左下にある四角部分をマーカーに使う):汎用性低
|
76
|
+
|
77
|
+
- 画像として認識させる:お勧めしません(先の画像認識の下りの部分を参照ください)が、深層学習で対応するのであれば、データ増強の際に画像をゴリゴリ回転させたり反転させたりすることで対応できます・
|
48
78
|
|
49
79
|
|
50
80
|
|
@@ -64,6 +94,8 @@
|
|
64
94
|
|
65
95
|
3. OCRで文字認識(可能であれば独自データセットを作成)
|
66
96
|
|
97
|
+
3.1 画像が上下反転する可能性があるのであれば、画像を上下反転(180°回転)させて3-5の処理を実施
|
98
|
+
|
67
99
|
|
68
100
|
|
69
101
|
4. 文字を繋げて文章化
|