https://www.codexa.net/collaborative-filtering-k-nearest-neighbor/
上記のサイトのコードを参考にしながら、映画のレコメンド機能を実装しています。
ピボットさせるところで行き詰まっております。
python
1import pandas as pd 2import numpy as np 3from scipy.sparse import csr_matrix 4from sklearn.neighbors import NearestNeighbors 5 6ratings = pd.read_csv('ratings.csv') 7movie = pd.read_csv('movies_metadata.csv') 8movie=movie[['id','title']] 9ratings=ratings[['userId','movieId','rating']] 10movie_new=movie.rename(columns={'id' : 'movieId'}) 11movie_new["movieId"] = movie_new["movieId"].astype(int) 12 13merged = ratings.merge(movie_new, on="movieId") 14merged= merged[['userId','title','rating']] 15 16movie_pivot = merged.pivot(index= 'title',columns='userId',values='rating').fillna(0) 17movie_pivot_sparse = csr_matrix(movie_pivot.values)
最後の2行を実行すると、
ValueError: Index contains duplicate entries, cannot reshape
このようなエラーが出ます。
どのようにすればよいのでしょうか。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/07/23 23:23