前提・実現したいこと
CSVデータ(列14個、45万レコード)をPandasで読み込み、
特定の1列を除く全ての列を対象に複数グルーピングで
重複件数をカウントして、列名「'count'」を追加して格納したいです。
発生している問題・エラーメッセージ
Series([], dtype: int64)
該当のソースコード
Python
1import pandas as pd 2 3csv_data = pd.read_csv("csv_data.csv", sep=",") 4csv_data.groupby(['列名1','列名2',…,'列名13']).size()
試したこと
列名14を除く全ての列を対象にグルーピングして重複カウントを
行おうとしましたが、戻りが空になりました。
groupbyに渡す列名を削っていき、列名10まででグルーピングしたところ、
カウントした件数が正しく返ってきたので、groupbyへ渡す列名が11個以上に
なると対応できないように見えます。
'count'という列を追加してそこに重複件数を格納するところまで
やりたいのですが、つまづいてしまい進めません。
教えていただけると助かります、よろしくお願いします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。