質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

1回答

1146閲覧

pandasでgroupbyとcountで挙動がわかりません

退会済みユーザー

退会済みユーザー

総合スコア0

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2020/09/24 04:23

データ分析初心者です。
実践データ分析100本ノックをやっていますが、25本目で挙動がわからないところがあります。
どなたか教えて頂ければ幸いです。
よろしくお願いいたします。

コードは下の通りです。

print(uselog.head()) # log_id customer_id usedate # 0 L00000049012330 AS009373 2018-04-01 # 1 L00000049012331 AS015315 2018-04-01 # 2 L00000049012332 AS040841 2018-04-01 # 3 L00000049012333 AS046594 2018-04-01 # 4 L00000049012334 AS073285 2018-04-01 uselog["usedate"] = pd.to_datetime(uselog["usedate"]) uselog["年月"] = uselog["usedate"].dt.strftime("%Y%m") uselog_months = uselog.groupby(["年月", "customer_id"], as_index=False).count() print(uselog_months.head()) # 年月 customer_id log_id usedate # 0 201804 AS002855 4 4 # 1 201804 AS009013 2 2 # 2 201804 AS009373 3 3 # 3 201804 AS015315 6 6 # 4 201804 AS015739 7 7 uselog_months.rename(columns={"log_id": "count"}, inplace=True) del uselog_months["usedate"]

質問1.
一番最後の「use_log_months["usedate"]」には「4,2,3,6,7」と数値が入っています。
この数値はいつどのように入ってきているのでしょうか。

質問2.
log_idをcountと名前を変更しているみたいなのですが、なぜcountの結果がlog_idカラムに入ってきてしまっているのでしょうか?

どなたかご回答頂ければ幸いです。
よろしくお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2020/09/24 04:28

groupbyについて調べることはされましたか?(何も調べていないように見受けられましたので)
退会済みユーザー

退会済みユーザー

2020/09/24 04:42

すいませんでした。 グループ化した以外のカラムは全てcountが入るのですね。 カウントされたものが2カラムに表示されていたり、カラム名がそのままなので混乱してつい質問してしまいました。申し訳ございませんでした。 わざわざコメント頂いてしまいありがとうございました。
guest

回答1

0

ベストアンサー

基本的な事がわかっておりませんでした。申し訳ありません。
グループ化されていないカラム対象にカウントの結果が入るみたいです。
https://deepage.net/features/pandas-count.html

投稿2020/09/24 04:45

退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問