以前にも似たような内容について質問しているのですが、もう一度気になったので質問します。
単語の分散表現を用いて何か工夫することにより感情分析の精度を上げることは可能なのでしょうか?
以前質問した際はword2vecを用いて単純にある文章と「喜,怒,哀,楽」の近さを調べていたのですが、これではあまり正確ではない結果が出てしまいました。
考えた改善策としては「喜,怒,哀,楽」のラベルのついた文章をできるだけ集めてデータを作り、集めたデータをラベルごとにベクトル化して平均を取ります。そして感情分析したい文章と「喜,怒,哀,楽」の平均を取ったデータとの類似度を調査して、一番類似度が高かったラベルに分類するという方法はどうでしょうか?
word2vecを用いるので前後の文脈からの推測はできないのですが、「喜び」の1単語ではなく「喜びを含んだ文章の平均」で類似度を見るため多少は結果が変わると考えています。(作成するデータにもよりますが)
この方法ではよくない点や、他の工夫の仕方などアドバイスいただけると幸いです。
あなたの回答
tips
プレビュー