質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.31%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

1回答

4208閲覧

Pandasで指定範囲の最大値を求めたい

morimori_4

総合スコア22

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2022/02/27 11:26

編集2022/02/27 14:06

Pandasで時系列データを集計しています。
ある条件が発生してから次の条件発生までの範囲の最大値を求めたいのですが、applyを使わずに簡潔に記載する方法はないでしょうか?

実現したいこと

下の表で Cond=True の場合、現在のPriceを代入
Cond=Falseの場合、「以前のCond=TrueのPrice」と「現在のPrice」のうち大きい方を代入
例:行1 Cond=True → Price=450(現在のPrice)
行2 Cond=False → Price=450(前の行が大きい)
行3 Cond=False → Price=450(2つ前の行が大きい)

python

1iimport pandas as pd 2import numpy as np 3df = pd.DataFrame({'Price': [350, 450, 300, 250, 400, 550, 600 ], 4 'Cond': [False, True, False, False, False, True, False]})

python

1 Price Cond 20 350 False 31 450 True 42 300 False 53 250 False 64 400 False 75 550 True 86 600 False

求めたい結果と現状のapplyでの処理は以下です。
簡潔化と処理速度向上を計りたいです。rolling()でwindowの数値を変えればできるかと試したのですが、うまくいかず、良い方法があれば教えていただけないでしょうか。

どうぞよろしくお願いいたします。

python

1 Price Cond bar_index pvid New 20 350 False 0 0 350.0 31 450 True 1 1 450.0 42 300 False 2 1 450.0 53 250 False 3 1 450.0 64 400 False 4 1 450.0 75 550 True 5 5 550.0 86 600 False 6 5 600.0 9--------------------------------------------------------- 10df['bar_index']=df.index 11df.loc[df['Cond']==True, 'pvid'] = df['bar_index'] 12df['pvid'] = df['pvid'].fillna(method='ffill').fillna(0).astype(int) 13 14def set_pivot(x): 15 if x['Cond']: 16 df.loc[x['bar_index'], 'New'] = df.loc[x['bar_index'], 'Price'] 17 elif x['Cond']==False: 18 df.loc[x['bar_index'], 'New'] = df.loc[x['pvid']:x['bar_index'], 'Price'].max() 19 20df.apply(set_pivot, axis=1)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

python

1import pandas as pd 2import numpy as np 3 4df = pd.DataFrame({ 5 'Price': [350, 450, 300, 250, 400, 550, 600 ], 6 'Cond': [False, True, False, False, False, True, False] 7}) 8 9df['new'] = df.groupby(df['Cond'].cumsum())['Price'].cummax() 10print(df) 11 12# 13 Price Cond new 140 350 False 350 151 450 True 450 162 300 False 450 173 250 False 450 184 400 False 450 195 550 True 550 206 600 False 600

投稿2022/02/27 12:45

melian

総合スコア21118

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

morimori_4

2022/02/27 13:32

回答いただき感謝しております。 やりたかったことに対する100%の回答です。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.31%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問