サンプルコードで
csv fileを読み込み、最初の行を取り出すまでに
data.drop_duplicates(keep='last', inplace=True)
という行のコードがありました。
このdrop_duplicatesの役割がわかりません。
ネットには、値が重複したデータを削除する役割を持つと書いていますが、
”重複した値”が何を示すのかがわかりません。
http://sinhrks.hatenablog.com/entry/2014/11/15/230705
drop_duplicatesの役割は何なのでしょうか?
全体は
import pandas as pd import numpy as np import matplotlib.pyplot as plt import scipy.spatial as sp import scipy.sparse as sparse from sklearn.decomposition import NMF, TruncatedSVD #csv fileの読み込み data = pd.read_csv('user_topic_follow_dummy.csv', encoding='utf8') data.drop_duplicates(keep='last', inplace=True) print(data.shape) data.head()
のようになっています。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
退会済みユーザー
2017/06/12 13:19
2017/06/12 23:39
退会済みユーザー
2017/06/13 00:42