「pythonで日本語文の感情分析(+言語処理の基礎)」という記事を読み、
(https://qiita.com/mtskhs/items/0323f299d03f5b07efdc)
単語感情極性対応表
(http://www.lr.pi.titech.ac.jp/~takamura/pndic_ja.html)
を用いて、実際に日本語の文章を分析しました。
その結果、マイナス(ネガティブ感情)値ばかりが出力されます。
この「対応表」を見ると、
(http://www.lr.pi.titech.ac.jp/~takamura/pubs/pn_ja.dic)
名詞の大部分がマイナスになっています。
例えば一部をコピペすると:
ヴァニラ:ヴァニラ:名詞:-0.216051
カフェテリア:カフェテリア:名詞:-0.216076
切れ字:きれじ:名詞:-0.216081
買物:かいもの:名詞:-0.216081
著者:ちょしゃ:名詞:-0.216083
といった具合です。「辞書内にある単語のおよそ90%は、マイナス値の単語として分類されています。
たとえば「買物」という言葉が出てくると、その文章全体に−0.2が加算されてしまいます。
万事がこういった具合なので、およそ世の中の日本語文は、「これはネガティブである」と解釈されることになってしまうはずだと思いました。
この結果は少なくとも直感的ではない!
だけど、どうしてこういう事になっているのだろう?
・・・というのが疑問です。
もしもこの事についてご存知の方がいましたら、お教え下さい!
あなたの回答
tips
プレビュー