回答編集履歴

2

補足を追加

2019/11/10 23:28

投稿

magichan
magichan

スコア15898

test CHANGED
@@ -91,3 +91,45 @@
91
91
  limit -= drop_size
92
92
 
93
93
  ```
94
+
95
+
96
+
97
+ ---
98
+
99
+ **【追記2】**
100
+
101
+ だいたい、こんな感じになるのではないでしょうか(動作は全く未検証)
102
+
103
+ ```Python
104
+
105
+ import pandas as pd
106
+
107
+ import numpy as np
108
+
109
+
110
+
111
+ for list_no in range(1,3):
112
+
113
+ df = pd.read_csv(f"list{list_no}.csv")
114
+
115
+ label = pd.cut(df['time2'], bins=np.arange(0, 10.5, 0.5), right=False, labels=False)
116
+
117
+
118
+
119
+ limit = 5
120
+
121
+ for i in range(0,20):
122
+
123
+ drop_size = min((label == i).sum(), limit)
124
+
125
+ drop_index = df.loc[label==i,'time2'].sort_values().index[:drop_size]
126
+
127
+ df = df.drop(drop_index)
128
+
129
+ new_file = f"list{list_no}_{(i+1)*0.5:.1f}f.csv"
130
+
131
+ df.to_csv(new_file)
132
+
133
+ limit -= drop_size
134
+
135
+ ```

1

サンプルを追加

2019/11/10 23:28

投稿

magichan
magichan

スコア15898

test CHANGED
@@ -65,3 +65,29 @@
65
65
  ```
66
66
 
67
67
  のようにtime2の値でソートして頭からn個のIndex値を対象とすると良いのではないでしょうか。
68
+
69
+
70
+
71
+ ---
72
+
73
+ **追記**
74
+
75
+ 削除する行数を全体で制限する場合のサンプル
76
+
77
+ ```
78
+
79
+ limit = 5
80
+
81
+ for i in range(0,20):
82
+
83
+ drop_size = min((label == i).sum(), limit)
84
+
85
+ drop_index = df.loc[label==i,'time2'].sort_values().index[:drop_size]
86
+
87
+ df = df.drop(drop_index)
88
+
89
+ df.to_csv(f"list1_{(i+1)*0.5:.1f}f.csv")
90
+
91
+ limit -= drop_size
92
+
93
+ ```