🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

2783閲覧

python 複数条件でgroupby rankした値を追加し、新たなカラムを作りたい

退会済みユーザー

退会済みユーザー

総合スコア0

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2019/09/11 02:42

実現したいこと

複数条件(日付・月)でgroupby rankした値で新たなカラムを作りたい。

試したこと

python

1data={'day':[20190101,20190101,20190202,20190303,20190111,20190222,20190311],'month':[1,1,2,3,1,2,3],'no':['A','A','A','A','A','A','A']} 2frame=pd.DataFrame(data,columns=['no','day','month']) 3frame=frame.astype(str) 4frame['day'] = pd.to_datetime(frame['day'].astype('str'),errors = 'coerce') 5 6frame['count'] = frame.groupby("no")["day"].rank(ascending=True, method='dense').astype(int) 7#日付ごとでのカウントはできましたが、月を組み合わせたランク付けができずに模索しております。 8 9#   no day month count 10#0 A 2019-01-01 1 1 11#1 A 2019-01-01 1 1 12#2 A 2019-02-02 2 3 13#3 A 2019-03-03 3 5 14#4 A 2019-01-11 1 2 15#5 A 2019-02-22 2 4 16#6 A 2019-03-11 3 6

希望のデータカラム(count_day_month)

python

1#   no day month count_day_month 2#0 A 2019-01-01 1 1 3#1 A 2019-01-01 1 1 4#2 A 2019-02-02 2 1 5#3 A 2019-03-03 3 1 6#4 A 2019-01-11 1 2 7#5 A 2019-02-22 2 2 8#6 A 2019-03-11 3 2

→月ごとでrank付けを完結させ、同日付のものは同じ値を入れたいです。

お詳しい方ご教授いただければ、幸いです。
何卒宜しくお願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

以下のように、DataFrame.groupby() によるグループ化の対象を "no" だけではなく "month" を追加してから、"day" 列でのrank()を求めると良いかと思います。

Python

1import pandas as pd 2 3data = { 4 'day' : ['20190101','20190101','20190202','20190303','20190111','20190222','20190311'], 5 'month':[1,1,2,3,1,2,3], 6 'no': ['A','A','A','A','A','A','A'] 7} 8 9frame=pd.DataFrame(data,columns=['no','day','month']) 10frame['day'] = pd.to_datetime(frame['day'], errors='coerce') 11 12frame['count'] = frame.groupby("no")["day"].rank(ascending=True, method='dense').astype('uint8') 13frame['count_day_month'] = frame.groupby(["no", "month"])["day"].rank(ascending=True, method='dense').astype('uint8') 14print(frame) 15# no day month count count_day_month 16#0 A 2019-01-01 1 1 1 17#1 A 2019-01-01 1 1 1 18#2 A 2019-02-02 2 3 1 19#3 A 2019-03-03 3 5 1 20#4 A 2019-01-11 1 2 2 21#5 A 2019-02-22 2 4 2 22#6 A 2019-03-11 3 6 2

投稿2019/09/11 03:30

編集2019/09/11 04:26
magichan

総合スコア15898

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問