回答率: 85.31%

質問するログイン新規登録

トップに関する質問 pythonのpandasでのピボット風データ集約（サイズ大）について

編集履歴

質問編集履歴

6

2016/06/06 22:46

投稿

スコア15

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -38,11 +38,11 @@
 df.pivot_table('url',index='id',columns='item',aggfunc='count')
+```
  「ValueError: negative dimensions are not allowed」
-```

5

2016/06/06 22:46

投稿

スコア15

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -1,4 +1,6 @@
-下記のようなレコード数が300万ぐらいのログデータがあります。
+レコード数が300万ぐらいのログデータがあります。
+以下の集計したい項目のほかに、urlや時間などの項目もあります。。
@@ -26,13 +28,21 @@
 ～～～～～～～～～～～～～～～～～～～～～～～～～～～～～～～～
-・1:pivotで集約
+・1通り目:pivotで集約
  pivot_tableで集約しようとすると、次のようなエラーが出ます。
+```python
+df.pivot_table('url',index='id',columns='item',aggfunc='count')
  「ValueError: negative dimensions are not allowed」
+```
@@ -56,9 +66,9 @@
 df1 = DataFrame(index=df['id'].unique(),columns=df['item'].unique())
-for i in range(len(df1['id'])):
+for i in range(len(df['id'])):
- f2.ix[df1.iloc[i,0],df1.iloc[i,1]]=1
+ df1.ix[df.iloc[i,0],df.iloc[i,1]]=1
 ```

4

補足

2016/06/06 22:45

投稿

スコア15

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -70,4 +70,4 @@
-別の方法など、お知恵をいただければ幸いです。
+1通り目に関してのpivotでのエラーの回避方法、もしくは別の方法などのお知恵をいただければ幸いです。

3

2016/06/06 10:55

投稿

スコア15

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -71,11 +71,3 @@
 別の方法など、お知恵をいただければ幸いです。
-※スタックオーバーフローとのマルチポストです。
-どちらかで解決しましたらフィードバックいたします。
-http://ja.stackoverflow.com/questions/26496/python%E3%81%AEpandas%E3%81%A7%E3%81%AE%E3%83%94%E3%83%9C%E3%83%83%E3%83%88%E9%A2%A8%E3%83%87%E3%83%BC%E3%82%BF%E9%9B%86%E7%B4%84-%E3%82%B5%E3%82%A4%E3%82%BA%E5%A4%A7-%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6

2

2016/06/06 09:28

投稿

スコア15

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -71,3 +71,11 @@
 別の方法など、お知恵をいただければ幸いです。
+※スタックオーバーフローとのマルチポストです。
+どちらかで解決しましたらフィードバックいたします。
+http://ja.stackoverflow.com/questions/26496/python%E3%81%AEpandas%E3%81%A7%E3%81%AE%E3%83%94%E3%83%9C%E3%83%83%E3%83%88%E9%A2%A8%E3%83%87%E3%83%BC%E3%82%BF%E9%9B%86%E7%B4%84-%E3%82%B5%E3%82%A4%E3%82%BA%E5%A4%A7-%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6

1

code

2016/06/06 08:34

投稿

スコア15

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -50,13 +50,17 @@
- df=pd.read_csv('logdata.csv')
+```python
- df1 = DataFrame(index=df['id'].unique(),columns=df['item'].unique())
+df=pd.read_csv('logdata.csv')
- for i in range(len(df1['id'])):
+df1 = DataFrame(index=df['id'].unique(),columns=df['item'].unique())
+for i in range(len(df1['id'])):
-   df2.ix[df1.iloc[i,0],df1.iloc[i,1]]=1
+ f2.ix[df1.iloc[i,0],df1.iloc[i,1]]=1
+```
 ～～～～～～～～～～～～～～～～～～～～～～～～～～～～～～～～

【募集】

teratailを一緒に作りたいエンジニア

サービス紹介

teratailとは？公式ブログバッジとは?運営からのお知らせ称号とは?teratail API タグ一覧ヘルプユーザーランキングお役立ちコンテンツ

関連サービス

フリーランスエンジニア支援レバテックフリーランスフリーランスクリエイター支援レバテッククリエイターエンジニア新卒就職レバテックルーキー大学生/大学院生向けプログラミングスクールレバテックカレッジエンジニア転職エージェントレバテックキャリアスカウト機能付き求人メディアレバテックダイレクトキャリアと技術の可能性が見つかるメディアレバテックLAB

回答は行っておりません

返信の必要なお問い合わせはこちら

運営会社利用規約行動規範個人情報の取り扱い広告掲載のお問い合わせ

レバレジーズグループ関連サービス

レバテックレバテックフリーランスレバテッククリエイターレバテックキャリアレバテックダイレクトレバテックルーキーレバテックカレッジ teratail レバテックプラットフォームフリーランスHub レバテック（フリーランス向けサービス紹介）レバテック（正社員転職サービス紹介）

キャリアチケットキャリアチケット就職エージェントキャリアチケットカフェキャリアチケット就職スカウトキャリアチケット転職キャリアチケット転職エージェントハタラクティブハタラクティブプラスワークリアレバレジーズM&Aアドバイザリーレバクリレバウェルレバウェル介護レバウェル看護レバウェル保育士レバウェル医療技師レバウェルリハビリレバウェル栄養士レバウェル医師レバウェル薬剤師レバレジーズメディカルケアわんコネ WeXpats Leverages Global Support Leverages Global（上海）レバレジーズキャリアメキシコ NALYSYS モチベーション管理 NALYSYS 労務管理

© 2014-2025 Leverages Co., Ltd.