前提・実現したいこと
初めて質問させていただきます。
現在、pythonにてベクトルのコサイン類似度を求める作業をしています。
その際、データフレームを2つ用意し、それぞれ上から一行ずつ取り出してコサイン類似度を求めようとしています。(以下のようなデータフレームが2つあるイメージです)
これらをリスト化し、以下の処理を実行しましたがうまくいきませんでした。
インデックス名 1 2 3 4…
名前 数字 数字 数字 数字…
名前 …
名前 …
発生している問題・エラーメッセージ
ValueError: shapes (682,768) and (682,768) not aligned: 768 (dim 1) != 682 (dim 0)
該当のソースコード
import numpy as np
def cos_similarity(v1, v2):
return np.dot(v1, v2) / (np.linalg.norm(v1) * np.linalg.norm(v2))
print(cos_similarity(リスト名, リスト名))
試したこと
上記のエラーメッセージから、データフレームの方に瑕疵があるかと思い調べましたが、特に問題はないように思われました。
解決方法が分かる方がいらっしゃいましたら、教えていただけないでしょうか。
何卒宜しくお願い致します。
補足情報(FW/ツールのバージョンなど)
ここにより詳細な情報を記載してください。
回答2件
あなたの回答
tips
プレビュー