質問編集履歴
4
追記
test
CHANGED
File without changes
|
test
CHANGED
@@ -24,7 +24,17 @@
|
|
24
24
|
|
25
25
|
https://www.nuget.org/packages/Tesseract/4.1
|
26
26
|
|
27
|
-
からTesseract4.0の本体と一緒にダウンロードインストールしたものを使用しました。
|
27
|
+
からTesseract4.0の本体と一緒にダウンロードインストールしたものを使用しました。英語の学習データだけです。
|
28
|
+
|
29
|
+
[tessdata]
|
30
|
+
|
31
|
+
├─eng.traineddata
|
32
|
+
|
33
|
+
├─eng.user-patterns
|
34
|
+
|
35
|
+
└─eng.user-words
|
36
|
+
|
37
|
+
実行ファイルと同じフォルダにこの学習データが格納されたフォルダを配置しています。
|
28
38
|
|
29
39
|
|
30
40
|
|
3
補足
test
CHANGED
File without changes
|
test
CHANGED
@@ -2,7 +2,9 @@
|
|
2
2
|
|
3
3
|
掲題の通りです。
|
4
4
|
|
5
|
-
|
5
|
+
下に掲載しているソースコードでは、文字を抽出することが出来ませんでした。
|
6
|
+
|
7
|
+
文字の白い部分を抜き出すような画像処理を施しています。
|
6
8
|
|
7
9
|
|
8
10
|
|
2
補足
test
CHANGED
File without changes
|
test
CHANGED
@@ -10,26 +10,30 @@
|
|
10
10
|
|
11
11
|
Tesseract 4.1.0-beta1
|
12
12
|
|
13
|
+
です。nugetから取得したものを使用しました。C#用のライブラリです。
|
14
|
+
|
15
|
+
また、画像処理には、OpenCvSharpを、これもnugetから取得したものを使用しています。
|
16
|
+
|
17
|
+
Tesseract, OpenCvSharpの使用は必須ではありませんが、これらを使用してプログラムを作成しているので、できればこれに沿った方法が希望です。
|
18
|
+
|
19
|
+
|
20
|
+
|
21
|
+
学習データについては、
|
22
|
+
|
23
|
+
https://www.nuget.org/packages/Tesseract/4.1
|
24
|
+
|
25
|
+
からTesseract4.0の本体と一緒にダウンロードインストールしたものを使用しました。
|
26
|
+
|
27
|
+
|
28
|
+
|
29
|
+
使用した画像は
|
30
|
+
|
31
|
+
![イメージ説明](1b73f19262467f71c46aadd42811f02b.png)
|
32
|
+
|
13
33
|
です。
|
14
34
|
|
15
35
|
|
16
36
|
|
17
|
-
学習データについては、
|
18
|
-
|
19
|
-
https://www.nuget.org/packages/Tesseract/4.1
|
20
|
-
|
21
|
-
からTesseract4.0の本体と一緒にダウンロードインストールしたものを使用しました。
|
22
|
-
|
23
|
-
|
24
|
-
|
25
|
-
使用した画像は
|
26
|
-
|
27
|
-
![イメージ説明](1b73f19262467f71c46aadd42811f02b.png)
|
28
|
-
|
29
|
-
です。
|
30
|
-
|
31
|
-
|
32
|
-
|
33
37
|
ソースコードを下に掲載します。
|
34
38
|
|
35
39
|
Windows Formです。
|
1
試したことを追加
test
CHANGED
File without changes
|
test
CHANGED
@@ -2,6 +2,8 @@
|
|
2
2
|
|
3
3
|
掲題の通りです。
|
4
4
|
|
5
|
+
作成したプログラムでは、文字を抽出することが出来ませんでした。
|
6
|
+
|
5
7
|
|
6
8
|
|
7
9
|
Tesseractのバージョンは
|