質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

2回答

279閲覧

[datafream]前の行より値が小さかったら削除(この処理を繰り返したい)

aaaskw123123

総合スコア13

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2022/07/12 09:27

実現したいこと

イメージ説明
↑のようなカラム名がindex,valueという**データフレーム(test1)**があります。
value列の前の行と比べて数値が減っていたらその行を削除するというプログラムを作りたいです。

書きたいプログラムとしては、
value列の数字を行ごとに引き算していく
例:2行目-1行目→30-9=21

引き算後のデータフレーム(test_diff)
イメージ説明

マイナス行を削除したデータフレーム(test2)
イメージ説明
※画像データフレーム名がtest1とありますがtest2の間違いです。
これで完成したと思いたいところですが、
index15 を削除してもその下のindex16の値50のためindex14よりも減っている値になってしまいます。
そのため、この計算を何度も繰り返して完成形にもっていきたいです。

該当のソースコード

Python

1 #※実際はindex番号が複数重複しているためindexごとでfor文を回しています。 2 for~以下省略 3    #処理↓ 4 #上下で計算 5 test1_diff=test1['value'].diff() 6 #0行目はそのまま 7 test1_diff[0]=test['value'].iloc[0] 8 #負の数の行を抽出する 9 index=np.where(test1_diff<0)[0] 10 #index行を削除する 11   #以下略

↑上記のプログラムですと1度で終わってしまうので
マイナスがなくなるまで処理を繰り返したいです。
ご教授お願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

要するに単調増加する行のみ抽出したいということでしょうか。
であれば基本的な考えとしては、現時点での最大値を保持しておき、それ以上のみを取り出せばよいです。

以下、単純なループで実現するリストでのコード例ですが、もしかするとpandasの演算のみでもっとスマートにできるかもしれません。

Python

1import pandas as pd 2 3df = pd.DataFrame({'value':[1,3,5,4,5,4,3,3,4]}) 4vs = df['value'].tolist() 5 6ret,ret_i = [], [] 7cur_max = vs[0] 8for i,v in enumerate(vs): 9 if v >= cur_max: 10 cur_max = v 11 ret.append(v) 12 ret_i.append(i) 13 14print(ret) #[1, 3, 5, 5] 15print(ret_i)#[0, 1, 2, 4]

投稿2022/07/12 09:49

編集2022/07/13 07:37
can110

総合スコア38262

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

aaaskw123123

2022/07/13 07:29 編集

ありがとうございます!! 無事やりたいことができてとてもすっきりしました✨ ちなみになんですが、リスト(ret)の値の行番号をとりたいのですが 可能でしょうか?? (retで得た値がdfの何行目かを知りたい)
can110

2022/07/13 07:39

コード修正しました。その行番号も同時にとればよいです。
aaaskw123123

2022/07/13 08:09

ありがとうございます、、!!本当に助かりました!<(_ _)>
guest

0

python

1import pandas as pd 2 3test1 = pd.DataFrame({ 4 'index': range(17), 5 'value': [ 6 9, 30, 55, 83, 120, 128, 128, 128, 140, 7 141, 175, 176, 200, 240, 270, 40, 50 8 ], 9}) 10 11test1_diff = test1.query('value == value.cummax()').reset_index(drop=True) 12print(test1_diff)

投稿2022/07/12 09:44

編集2022/07/12 23:16
melian

総合スコア19714

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

aaaskw123123

2022/07/13 07:28

ありがとうございます!! 無事解決することができました!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問