回答率: 85.29%

質問するログイン新規登録

トップ Pythonに関する質問 DataFrameからの値抽出アルゴリズム

編集履歴

回答編集履歴

1

サンプルコードを追記

2019/01/26 14:33

投稿

スコア1133

answer CHANGED Viewed

@@ -6,4 +6,46 @@
 　for a~d列ごと
 　　あるIDのある列の値がNanでも0でもないものを抽出
 　　　そのうちの最古日付の値を保存（なければNan）
+```
+【追記】
+解決したようでなによりです。
+サンプルを実装してみたので、こういう方法もありだなと思って頂ければ幸いです。
+以下、サンプルCSV、コード、結果出力。
+```csv
+id	date	val
+1	2017-01-01	NaN
+1	2017-01-02	1
+2	2017-01-01	2
+2	2017-01-02	3
+3	2017-01-01	0
+3	2017-01-02	NaN
+```
+```Python
+import pandas as pd
+df = pd.read_csv('data.csv', delimiter='\t')
+id_list = df.id.unique()
+# 値が0かNaNの行を削除
+df = df.loc[df.val != 0]
+df = df.dropna()
+for id in id_list:
+    df_id = df.loc[df.id == id] # idごとのDataFrame
+    if len(df_id) == 0:
+        print('id:{} is val:Nan'.format(id))
+    else:
+        # 日付が最小の行を抽出
+        min_row = df_id.loc[df_id.date == df_id.date.min()]
+        print('id:{} is val:{}'.format(id, min_row.values[0][2]))
+```
+```sh
+id:1 is val:1.0
+id:2 is val:2.0
+id:3 is val:Nan
 ```