質問編集履歴

1

自己解決のアプローチを追記

2019/02/03 09:17

投稿

momochi
momochi

スコア68

test CHANGED
File without changes
test CHANGED
@@ -107,3 +107,31 @@
107
107
  Sv~ntaxE「「o「: EOLwhilescanningstrin91tteral
108
108
 
109
109
  ```
110
+
111
+
112
+
113
+ ---
114
+
115
+ ### 追記
116
+
117
+ テキストを取り出したい理由は,合成音声に読ませて,学習の助けになるかなぁ,と思ったからです.
118
+
119
+ 本も見ながら音声を聞くので,精度は粗くても良いです.
120
+
121
+
122
+
123
+ 個人的に思いついたアプローチは,
124
+
125
+ 「各行について,ひらがなが5文字以下なら削除」です.
126
+
127
+ ```
128
+
129
+ さい。
130
+
131
+ ```
132
+
133
+ みたいな部分は削除されても構いません.
134
+
135
+
136
+
137
+ このアプローチで問題がありそうならコメントください.