回答率: 85.30%

質問するログイン新規登録

トップ CSVに関する質問 pythonのpandasで条件に応じて行を削除

編集履歴

回答編集履歴

2

補足を追加

2019/11/10 23:28

投稿

スコア15898

answer CHANGED Viewed

@@ -44,4 +44,25 @@
     df = df.drop(drop_index)
     df.to_csv(f"list1_{(i+1)*0.5:.1f}f.csv")
     limit -= drop_size
+```
+---
+**【追記２】**
+だいたい、こんな感じになるのではないでしょうか（動作は全く未検証）
+```Python
+import pandas as pd
+import numpy as np
+for list_no in range(1,3):
+    df = pd.read_csv(f"list{list_no}.csv")
+    label = pd.cut(df['time2'], bins=np.arange(0, 10.5, 0.5), right=False, labels=False)
+    limit = 5
+    for i in range(0,20):
+        drop_size = min((label == i).sum(), limit)
+        drop_index = df.loc[label==i,'time2'].sort_values().index[:drop_size]
+        df = df.drop(drop_index)
+        new_file = f"list{list_no}_{(i+1)*0.5:.1f}f.csv"
+        df.to_csv(new_file)
+        limit -= drop_size
 ```

1

サンプルを追加

2019/11/10 23:28

投稿

スコア15898

answer CHANGED Viewed

@@ -31,4 +31,17 @@
     df = df.drop(drop_target)
     df.to_csv(f"list1_{(i+1)*0.5:.1f}f.csv")
 ```
-のようにtime2の値でソートして頭からn個のIndex値を対象とすると良いのではないでしょうか。
+のようにtime2の値でソートして頭からn個のIndex値を対象とすると良いのではないでしょうか。
+---
+**追記**
+削除する行数を全体で制限する場合のサンプル
+```
+limit = 5
+for i in range(0,20):
+    drop_size = min((label == i).sum(), limit)
+    drop_index = df.loc[label==i,'time2'].sort_values().index[:drop_size]
+    df = df.drop(drop_index)
+    df.to_csv(f"list1_{(i+1)*0.5:.1f}f.csv")
+    limit -= drop_size
+```