質問編集履歴
1
自己解決のアプローチを追記
test
CHANGED
File without changes
|
test
CHANGED
@@ -107,3 +107,31 @@
|
|
107
107
|
Sv~ntaxE「「o「: EOLwhilescanningstrin91tteral
|
108
108
|
|
109
109
|
```
|
110
|
+
|
111
|
+
|
112
|
+
|
113
|
+
---
|
114
|
+
|
115
|
+
### 追記
|
116
|
+
|
117
|
+
テキストを取り出したい理由は,合成音声に読ませて,学習の助けになるかなぁ,と思ったからです.
|
118
|
+
|
119
|
+
本も見ながら音声を聞くので,精度は粗くても良いです.
|
120
|
+
|
121
|
+
|
122
|
+
|
123
|
+
個人的に思いついたアプローチは,
|
124
|
+
|
125
|
+
「各行について,ひらがなが5文字以下なら削除」です.
|
126
|
+
|
127
|
+
```
|
128
|
+
|
129
|
+
さい。
|
130
|
+
|
131
|
+
```
|
132
|
+
|
133
|
+
みたいな部分は削除されても構いません.
|
134
|
+
|
135
|
+
|
136
|
+
|
137
|
+
このアプローチで問題がありそうならコメントください.
|