これは,疑問になるのですが
単語の類似度について類似度を算出しようとした場合に,大抵のサイトではcos類似度が用いられているのですが,これ以外に単語の類似度をpythonで実現しようとした場合にはどのようなものがあるでしょうか?
気になる質問をクリップする
クリップした質問は、後からいつでもMYページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
回答2件
0
ベストアンサー
「単語の類似度の計算方法がコサイン類似度以外にあるか」という質問であれば、文字列の編集距離とかを使ったって出せますし、シソーラスでグラフ構造に基づく距離だって計算できますし、共起率とかで定義することもできますし、単語ベクトルの間の類似度にしたってコサイン類似度以外の計算方法は色々考えられるし……
星の数だけあります、という回答にしかならないのですが、
gensimでmost_similarを使うという状況であれば、基本的にはコサイン類似度を使うことになります。これはgensimがそういう実装だから、という以外の理由はありません。
投稿2021/01/27 13:20
総合スコア30935
0
コサイン類似度の他に、と問われたらレーベンシュタイン距離とかでしょうか。
そもそも類似とは何か、という話になりますけれども。
あるいはそうじゃなくて「word2vec を使うと便利ですよ」的な回答をご希望だったりしますでしょうか。
投稿2021/01/25 05:20
総合スコア2022
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/01/25 06:05
2021/01/25 07:24
2021/01/26 05:41
あなたの回答
tips
太字
斜体
打ち消し線
見出し
引用テキストの挿入
コードの挿入
リンクの挿入
リストの挿入
番号リストの挿入
表の挿入
水平線の挿入
プレビュー
質問の解決につながる回答をしましょう。 サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。 また、読む側のことを考えた、分かりやすい文章を心がけましょう。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。