質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

88.81%

Python Pandas 行列の入れ替え

解決済

回答 1

投稿

  • 評価
  • クリップ 0
  • VIEW 483

pon244

score 47

【欲しい結果】
・IDの1日ごとの数字をDataFrameへ
・上記の数字を横軸が時間、縦軸がSpend、折れ線グラフがIDのグラフ作成

【エラー部分】
Tronspose,Tなどを使用したが、うまくIDのユニークが出せない
実際のコード

import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
#エクセルを読む
df= pd.read_excel('test.xlsx',)
#A列がTIMEで複数あるからGroupByで合計
grp = df.groupby('Time').sum()
#CPxを出すために新しい行を追加作成
grp['CPx'] = grp['Spend'] / grp['Installs']
#時間を列に行にIDsを加える。列の値はSpend、Install、Cpx
#それをグラフにする
grp.head(10)

【grp.headの結果】
Idsの部分は同じIdsでも日付毎に全部IDがエクセルに入ってるので、下記の用にIDが足し算されてる

列1 列2 列3 列4 列4
Time Spend Install CPx IDs
11-Feb-2020 00:00 200 10 20 8332,32e
12-Feb-2020 00:00 100 10 10 8332,32e
13-Feb-2020 00:00 100 10 10 8332,32e

【欲しい結果】

列1 11-Feb-2020 00:00 12-Feb-2020 13-Feb-2020 00:00
IDs Spend Install Cpx
123445(uniqueのID) 200 10 20
123446(uniqueのID) 100 10 10
123447(uniqueのID) 100 10 10

【エクセルの形】

列1 列2 列3 列4 列4
Time Spend Install CPx IDs
11-Feb-2020 00:00 200 10 20 123445
12-Feb-2020 00:00 100 10 10 123445
13-Feb-2020 00:00 100 10 10 123446
11-Feb-2020 00:00 200 10 20 123446
12-Feb-2020 00:00 100 10 10 123447
13-Feb-2020 00:00 100 10 10 123447
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

checkベストアンサー

0

df = df.set_index(['IDs', 'Time'])
df = df.unstack()
df = df.swaplevel(axis=1).sort_index(axis=1)
#Time   11-Feb-2020 00:00                12-Feb-2020 00:00                 \
#                     CPx Install  Spend               CPx Install  Spend   
#IDs                                                                        
#123445              20.0    10.0  200.0              10.0    10.0  100.0   
#123446              20.0    10.0  200.0               NaN     NaN    NaN   
#123447               NaN     NaN    NaN              10.0    10.0  100.0
#
#Time   13-Feb-2020 00:00                 
#                     CPx Install  Spend  
#IDs                                      
#123445               NaN     NaN    NaN  
#123446              10.0    10.0  100.0  
#123447              10.0    10.0  100.0  

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2020/02/19 22:01

    import pandas as pd
    import matplotlib as mpl
    import matplotlib.pyplot as plt
    #エクセルを読む
    df= pd.read_excel('test.xlsx',)
    #A列がTIMEで複数あるからGroupByで合計
    grp = df.groupby('Time').sum()
    #CPxを出すために新しい行を追加作成
    grp['CPx'] = grp['Spend'] / grp['Installs']
    #時間を列に行にIDsを加える。列の値はSpend、Install、Cpx
    #それをグラフにする
    df = df.set_index(['IDs', 'Time'])
    df = df.unstack()
    df = df.swaplevel(axis=1).sort_index(axis=1)

    結果はIndex contains duplicate entries, cannot reshape
    が出てしまいます泣

    キャンセル

  • 2020/02/21 19:17

    私のコードでご質問の【欲しい結果】は出ていると思いますが違うのでしょうか?
    エクセルから読み込んだDataFrame(df)に対して私の回答のコードを適用してください。

    キャンセル

  • 2020/02/22 12:31

    df=df.set_index([‘IDs', 'Time '],append=True)
    append=Trueで解決しました!
    本当にありがとうございます!

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 88.81%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る