回答編集履歴

誤記訂正

2017/04/24 10:19

投稿

KSwordOfHaste

スコア18394

test CHANGED Viewed

@@ -56,4 +56,4 @@
 - 登録されている単語を<>で囲み忘れた
-それを機械的にチェックするには形態要素分析などをしないと「ヘンテコな単語を間違って取り出す」恐れが出てしまうので人間がチェックするという妥協でもよいと思います。
+それを機械的にチェックするには形態素解析などをしないと「ヘンテコな単語を間違って取り出す」恐れが出てしまうので人間がチェックするという妥協でもよいと思います。

誤記訂正

2017/04/24 10:19

投稿

KSwordOfHaste

スコア18394

test CHANGED Viewed

@@ -48,9 +48,9 @@
 - 単語が実際にあるかどうか
-辞書をDBへ登録する際に、あらかじめ全ての登録済み単語がわかっているかどうか人間がチェックするのは非常に面倒ですね。しかし考え方として「DBへ登録されていてもおかしくない単語」というほどの意味で'<>'でくくってしまってもよい場合もあるでしょう。wikipediaを見ていると「しかるべき単語」のリンクが張られているが実際にリンクを辿ると「未登録単語」になってたりしますね・・・そういうものがあってもかまわないという考え方もできると思います。
+説明文を作る際にあらかじめ全ての登録済み単語がわかっていたとしても人間がそれをチェックするのは非常に面倒ですね。しかし考え方として「DBへ登録されているべきしかるべき単語」ということを人間が判断して'<>'でくくってしまってもよいでしょう。wikipediaを見ていると「しかるべき単語」のリンクが張られていても実際にリンクを辿ると「未登録単語」になってたりしますね・・・そういうものがあってもかまわないという考え方もできると思います。
-もしそうしたリンク切れをユーザーに見せたくないとしたら、文章を整形する際に解析した結果得られた単語がDBに登録されているかどうかDB検索するという方法もありますが、その方法はいささか効率が悪いでしょう。本当にそういう配慮がしたければバッチで全レコードに対して一括でチェックして「不要な<>を取り去る」ということをするべきだと思います。
+もしそうしたリンク切れをユーザーに見せたくないとしたら、文章を整形する際に得られた単語一覧をDB登録済みかどうかチェックする方法もありますが、辞書をアクセスする度にそれを行うのはいささか効率が悪いでしょう。本当にそういう配慮がしたければバッチで全レコードに対して一括でチェックして「不要な<>を取り去る」ということをするべきだと思います。