質問編集履歴

3

スクショを登録

2024/03/14 15:25

投稿

shinro
shinro

スコア13

test CHANGED
File without changes
test CHANGED
@@ -103,6 +103,7 @@
103
103
 
104
104
  ### 補足
105
105
  <二値化等する前>
106
+ ![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2024-03-15/5508198d-e166-4d27-928e-876d0399d3e2.png)
106
107
  1 1 I ! 1 1 I ! 1 I 1 1 ! 1 1 1 1 1 ! 1
107
108
 
108
109
  IGT ien 0 iR 0 iR ii io io iiューューコー ーーュー ーー 」ュの 選吐
@@ -120,6 +121,7 @@
120
121
  ーー
121
122
 
122
123
  <二値化した後のterrasect>
124
+ ![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2024-03-15/1d256c41-429a-4217-80f6-7b234c716af6.png)
123
125
  に| cn 3 まこ ここ プロ とっ つい とっ 「プい いつ いこ) っ 1 ーー ーー ーー ーー ーー トー つ
124
126
  Fn HH やSs ピコ 間 il
125
127
  ー し
@@ -143,4 +145,5 @@
143
145
 
144
146
 
145
147
  <EasyOCR版>
148
+ ![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2024-03-15/a20180fe-d679-475c-8bd0-e5047862659b.png)
146
149
  留 留 記 品 8 齢 岩 迫 ` 台 呼 だ 窓 呂 る る さ 号 器 ワ ‥ こ 熟 = 曇 豊 ロ 1 糞 ~ こ @ 順 避 苗 @ ~ 邑 智 喜 喜 育 震 = 三 可 = 号 喜 可 言 宮 言 言 言 言 三 ! 宮 ‥ こ 美 三 | | こ 三 三 三 ごオ早さニ こ ごォ| | 巴 こ 三 | の ; ド 呂 る 器 呂 置 宮 呂 呂 呂 呂 呂 口 る ♪ 古 。 沓 。 宮 昌 昌 昌 昌 昌 昌 ・ ゆ ・ ・ 呂 | | 宮 呂 る 書 一 留 窓 8 会 留 っ 留 ~ + = 窓 口 窓 呂 留 会 呂 亘 号 ジ ヒ 一 ; ; 留 8 | 呂 会 』 @ 高 9 器 器 ` 。 弓 | 8 ・ 留 る 慧 器 昌 宮 昌 器 宮 | ゆ 台 の 一 呂 留 る 豆 器 さ 器 器 三 可 の 皆 望 る 曾 島 器 ら 露 器 宮 曽 る 曾 三 曽 三 三 弓 ・ 上 曽 言 喜 昌 言 ね 器 8 留 じ 器 呂 1 一 呂呂留 8 る呂 こ 呂 留 吾令 口さ 三可器宮弓留っ命 じ る 中口 言こ呂呂るら三呂 8 9 留 呂呂呂 露 品 中 命 ・ ぶ 一 6 ゆ る ・ と ゆ 中 中 ゆ口口 口ロ ・ @ 語も論邑 ロ・ ざ 巾 一 命 八・ 間 口 ゆ ゆ ・ ・ 舘 ‥? ‥? ‥? さ さ? 。? さ? 埼? 。? 。? 3? ば 台 。? 。? ハ? 3 高 _己 さ? さ ‥ 。? 点ば 。? さ? ‥ ‥? さ? さ? ゅ さ 一 一 き ゆ さ や 昂 昌 ブ 8 昌 曽 ‥ ミ ど 8 器 器 こ 令 曾 留 言 留 昌 昌 昌 昌 昌 昌 昌 昌 昌 昌 き 昌 昌 昌 昌 昌 昌 昌 昌 雪 中 さ ご さ さ さ ; ♪ ♪ 家 畠 言 品 留 器 る 呂 町 ♪ 呂 言 奇 ぐ 昌 器 愚 窓 重 昌 ミ 邑 留 齢 台 昌 ハり 呂 土 留 会 号 留 じ 呂 ツ 呂 畠 昌 舎 さ の の ♪ 呂 高 器 8 邑 邑 呂 言 言 舎 皆 高 器 舘 る 昌 留 曽 器 る る 昌 呂 宮 昌 舎 言 号 島 呂 呂 言 骨 器 呂 弓 称 ツ 量 呂治 るズこ こ ご留呂 ゆ 留呂留言呂っっ言吾留ミ鉛 太 中 台石司 口守 言三言言るるミミ言言言言ミ言 び る ・ 命 ]」

2

文字化けの内容の追記と二値化の意図の追記

2024/03/14 13:42

投稿

shinro
shinro

スコア13

test CHANGED
File without changes
test CHANGED
@@ -97,9 +97,50 @@
97
97
  - [ ] その他
98
98
 
99
99
  ##### 上記の詳細・結果
100
- 1.最初は二値化、モルフォロジー変換は実施していませんでしたが、その段階で文字化けがひどかったので、データを見やすくする意図でその2つの処理を追加しました。ただ、あまり改善した感じはしませんでした。
100
+ 1.最初は二値化、モルフォロジー変換は実施していませんでしたが、その段階で文字化けがひどかったので、データを見やすくする意図(元のデータに点線などが入っていて、その点線が、補足書くような「1」として表れているのかなと思って、点線を消うとしていました)でその2つの処理を追加しました。ただ、あまり改善した感じはしませんでした。
101
101
  2.tesseract OCRに問題があるのかなと思い、EasyOCRでも試しましたが、同様に意味不明な文字列が出力されました。
102
102
   tesseractOCRでは文字化けのような文字列が出てきて、EasyOCRでは漢字の羅列のようなデータが出てきました。
103
103
 
104
104
  ### 補足
105
- 特になし
105
+ <二値化等する前>
106
+ 1 1 I ! 1 1 I ! 1 I 1 1 ! 1 1 1 1 1 ! 1
107
+
108
+ IGT ien 0 iR 0 iR ii io io iiューューコー ーーュー ーー 」ュの 選吐
109
+
110
+ iA inO ioo ion io5 ioo ioっ iR nino 0 の jo5 iR jnm5 jiら0 joo joo 」R jm5b の 5 半 志
111
+
112
+ 1 | | | 1 | | | | | 1 1 | 1 | | 1 1 | 1 ごmm
113
+
114
+ ーー Ne ッ>て Ne
115
+
116
+ の 加 ら ご
117
+
118
+ NO四 品ら
119
+
120
+ ーー
121
+
122
+ <二値化した後のterrasect>
123
+ に| cn 3 まこ ここ プロ とっ つい とっ 「プい いつ いこ) っ 1 ーー ーー ーー ーー ーー トー つ
124
+ Fn HH やSs ピコ 間 il
125
+ ー し
126
+ 記 し し 立 秦 へ 名 和司ら
127
+ ーm ーー KT の てン 月 " 3
128
+ ET に h 性
129
+ し に電還 ーー コ
130
+ 半 邊了生に 病人時 s に al 間還|関人際 財
131
+ | ー ヽー マミ
132
+ ロ ヽー ヽー ロ
133
+ 国 全国全あつ | ョh m 三 ミミ< 半 に |
134
+ ii ー
135
+ | rl Nerd RT ー
136
+ ここ 間 マー 本 に 半 二話ー征只そ S
137
+ し ごーー さきニーささーー ーー 一叶 3 中
138
+ ここ てm でつら …、 の1 こり | トー こョ| ホバーででーーの> にコ ご> ーー ーー ーー ーー ーー ーー く
139
+ AI Qp のP G理王理CO の の邊G ちよ やごOら ら ーー で
140
+ 己 を 性 ジォニ 用 性 性 ごコル選ォニ ニニ ごテル包 避 ei二 用 避
141
+ トー ュン トー ニン ーー ーー ーー ーー にだ トー トコ の
142
+
143
+
144
+
145
+ <EasyOCR版>
146
+ 留 留 記 品 8 齢 岩 迫 ` 台 呼 だ 窓 呂 る る さ 号 器 ワ ‥ こ 熟 = 曇 豊 ロ 1 糞 ~ こ @ 順 避 苗 @ ~ 邑 智 喜 喜 育 震 = 三 可 = 号 喜 可 言 宮 言 言 言 言 三 ! 宮 ‥ こ 美 三 | | こ 三 三 三 ごオ早さニ こ ごォ| | 巴 こ 三 | の ; ド 呂 る 器 呂 置 宮 呂 呂 呂 呂 呂 口 る ♪ 古 。 沓 。 宮 昌 昌 昌 昌 昌 昌 ・ ゆ ・ ・ 呂 | | 宮 呂 る 書 一 留 窓 8 会 留 っ 留 ~ + = 窓 口 窓 呂 留 会 呂 亘 号 ジ ヒ 一 ; ; 留 8 | 呂 会 』 @ 高 9 器 器 ` 。 弓 | 8 ・ 留 る 慧 器 昌 宮 昌 器 宮 | ゆ 台 の 一 呂 留 る 豆 器 さ 器 器 三 可 の 皆 望 る 曾 島 器 ら 露 器 宮 曽 る 曾 三 曽 三 三 弓 ・ 上 曽 言 喜 昌 言 ね 器 8 留 じ 器 呂 1 一 呂呂留 8 る呂 こ 呂 留 吾令 口さ 三可器宮弓留っ命 じ る 中口 言こ呂呂るら三呂 8 9 留 呂呂呂 露 品 中 命 ・ ぶ 一 6 ゆ る ・ と ゆ 中 中 ゆ口口 口ロ ・ @ 語も論邑 ロ・ ざ 巾 一 命 八・ 間 口 ゆ ゆ ・ ・ 舘 ‥? ‥? ‥? さ さ? 。? さ? 埼? 。? 。? 3? ば 台 。? 。? ハ? 3 高 _己 さ? さ ‥ 。? 点ば 。? さ? ‥ ‥? さ? さ? ゅ さ 一 一 き ゆ さ や 昂 昌 ブ 8 昌 曽 ‥ ミ ど 8 器 器 こ 令 曾 留 言 留 昌 昌 昌 昌 昌 昌 昌 昌 昌 昌 き 昌 昌 昌 昌 昌 昌 昌 昌 雪 中 さ ご さ さ さ ; ♪ ♪ 家 畠 言 品 留 器 る 呂 町 ♪ 呂 言 奇 ぐ 昌 器 愚 窓 重 昌 ミ 邑 留 齢 台 昌 ハり 呂 土 留 会 号 留 じ 呂 ツ 呂 畠 昌 舎 さ の の ♪ 呂 高 器 8 邑 邑 呂 言 言 舎 皆 高 器 舘 る 昌 留 曽 器 る る 昌 呂 宮 昌 舎 言 号 島 呂 呂 言 骨 器 呂 弓 称 ツ 量 呂治 るズこ こ ご留呂 ゆ 留呂留言呂っっ言吾留ミ鉛 太 中 台石司 口守 言三言言るるミミ言言言言ミ言 び る ・ 命 ]」

1

詳細・結果の書き直し

2024/03/14 13:26

投稿

shinro
shinro

スコア13

test CHANGED
File without changes
test CHANGED
@@ -97,8 +97,9 @@
97
97
  - [ ] その他
98
98
 
99
99
  ##### 上記の詳細・結果
100
+ 1.最初は二値化、モルフォロジー変換は実施していませんでしたが、その段階で文字化けがひどかったので、データを見やすくする意図でその2つの処理を追加しました。ただ、あまり改善した感じはしませんでした。
100
- tesseract OCRに問題があるのかなと思い、EasyOCRでも試しましたが、同様に意味不明な文字列が出力されました。
101
+ 2.tesseract OCRに問題があるのかなと思い、EasyOCRでも試しましたが、同様に意味不明な文字列が出力されました。
101
- tesseractOCRでは文字化けのような文字列が出てきて、EasyOCRでは漢字の羅列のようなデータが出てきました。
102
+  tesseractOCRでは文字化けのような文字列が出てきて、EasyOCRでは漢字の羅列のようなデータが出てきました。
102
103
 
103
104
  ### 補足
104
105
  特になし