回答編集履歴

2

誤記訂正

2017/04/24 10:19

投稿

KSwordOfHaste
KSwordOfHaste

スコア18394

test CHANGED
@@ -56,4 +56,4 @@
56
56
 
57
57
  - 登録されている単語を<>で囲み忘れた
58
58
 
59
- それを機械的にチェックするには形態析などをしないと「ヘンテコな単語を間違って取り出す」恐れが出てしまうので人間がチェックするという妥協でもよいと思います。
59
+ それを機械的にチェックするには形態素析などをしないと「ヘンテコな単語を間違って取り出す」恐れが出てしまうので人間がチェックするという妥協でもよいと思います。

1

誤記訂正

2017/04/24 10:19

投稿

KSwordOfHaste
KSwordOfHaste

スコア18394

test CHANGED
@@ -48,9 +48,9 @@
48
48
 
49
49
  - 単語が実際にあるかどうか
50
50
 
51
- 辞書DBへ登録する際にあらかじめ全ての登録済み単語がわかっているかどうか人間がチェックするのは非常に面倒ですね。しかし考え方として「DBへ登録されていてもおしくない単語」というほどの意味で'<>'でくくってしまってもよい場合もあるでしょう。wikipediaを見ていると「しかるべき単語」のリンクが張られているが実際にリンクを辿ると「未登録単語」になってたりしますね・・・そういうものがあってもかまわないという考え方もできると思います。
51
+ 説明文る際にあらかじめ全ての登録済み単語がわかっていたとしても人間がそれをチェックするのは非常に面倒ですね。しかし考え方として「DBへ登録されているべきしるべき単語」ということを人間が判断して'<>'でくくってしまってもよいでしょう。wikipediaを見ていると「しかるべき単語」のリンクが張られていても実際にリンクを辿ると「未登録単語」になってたりしますね・・・そういうものがあってもかまわないという考え方もできると思います。
52
52
 
53
- もしそうしたリンク切れをユーザーに見せたくないとしたら、文章を整形する際に解析した結果得られた単語DB登録されているかどうかDB検索するという方法もありますが、その方法はいささか効率が悪いでしょう。本当にそういう配慮がしたければバッチで全レコードに対して一括でチェックして「不要な<>を取り去る」ということをするべきだと思います。
53
+ もしそうしたリンク切れをユーザーに見せたくないとしたら、文章を整形する際に得られた単語一覧をDB登録済みかどうかチェックする方法もありますが、辞書をアクセスする度にれを行うのはいささか効率が悪いでしょう。本当にそういう配慮がしたければバッチで全レコードに対して一括でチェックして「不要な<>を取り去る」ということをするべきだと思います。
54
54
 
55
55
 
56
56