編集履歴

質問編集履歴

現状

2019/01/26 13:43

投稿

ba-ba-ba

スコア16

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -17,10 +17,11 @@
 ### 発生している問題
+IDのunique数と同じデータ数を取得しなければならないが，下記のコードでは取得する数が少ない．
+ID：５００，c２：440
+となってしまう．
-どのようにコードを書いたらいいのかわかりません．
+nの場所が間違っているような気がしますが…
-少しでもご助言いただければ幸いです．
 ### 該当のソースコード
 ```python
 #データの読み込み
@@ -38,19 +39,22 @@
 c2 = []
 d3 = []
 for i in ID_uni:
+    #n = 1
     for j in range(len(test["ID"])):
+        print(n)
         if test["ID"][j] == i:
-            a = test["a"][j]
+            #a = test["a"][j]
             #b = test["b"][j]
-            #c = test["c"][j]
+            c = test["c"][j]
             #d　= test["d"][j]
-            if a != 0:
+            if c != 0:
-                a.append(a)
+                c2.append(c)
                 break
-            else :
+            elif n == test['ID'].value_counts()[i]:
-                a.append(np.nan)
+                c2.append(0)
+                break
+            n += 1
 ソースコード
 ```

現在の状態

2019/01/26 13:43

投稿

ba-ba-ba

スコア16

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -28,8 +28,29 @@
 test["date"] = pd.to_datetime(test['date'])
 test = test.set_index(["ID","date"])
+#今現在の状況
+test = test.reset_index(["ID","date"])
+ID_uni =  test["ID"].unique()
+test = test.fillna(0)
+a1 = []
+b1 = []
+c2 = []
+d3 = []
+for i in ID_uni:
+    for j in range(len(test["ID"])):
+        if test["ID"][j] == i:
+            a = test["a"][j]
+            #b = test["b"][j]
+            #c = test["c"][j]
+            #d　= test["d"][j]
+            if a != 0:
+                a.append(a)
+                break
+            else :
+                a.append(np.nan)
 ソースコード
 ```

データの読み込み追加

2019/01/26 12:52

投稿

ba-ba-ba

スコア16

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,10 +1,14 @@
 ###DataFrameからの値抽出アルゴリズムで困っています．
-下記のような階層構造のデータフレームにおいて![イメージ説明](51e99094f0e8c893ee379f91bed631d9.png)
+下記のようなデータフレームに置いて
-![イメージ説明](adbde6c209bd03e9ea57a827d1bfa0d6.png)
+![イメージ説明](e0e0d3bf5679437045b531a7f84778f1.png)
+![イメージ説明](e6411d6e830030d182ae8bc48ccaa576.png)
 各ID毎のa-dの値を抽出したい
 抽出する値は最も古いもの
 ###例
 ID272083の場合は
 a,cは2017-04-03の値（a:16662,c:2800.7）を採用するが
@@ -18,26 +22,17 @@
 ### 該当のソースコード
+```python
+#データの読み込み
+test = pd.read_csv()
+test["date"] = pd.to_datetime(test['date'])
+test = test.set_index(["ID","date"])
-```python
-a = []
-n = 0
-for k in pID_uni:
-    for m in range(len(file1_2["pID"])):
-        for i in range(len(file1_2.columns)-3):#横
-            for j in range(file1_2['pID'].value_counts()[pID_uni]):#縦
-                if k == file1_2["pID"][m]:
-                    if file1_2.iat[j,i+3]　!= 0:
-                        a.append(file1_2.iat[j,i+3])
-                    elif j == len(file1_2['pID'].value_counts()[pID_uni]):
-                        if file1_2.iat[j,i+3]　!= 0:
-                            a.append(file1_2.iat[j,i+3])
-                        else :
-                            a.append(0)
-                        n = n+1
 ソースコード
 ```
 ### 試したこと
-階層をはずしたりして，試行錯誤していますが，うまくいきません．
+階層をはずしたりし，試行錯誤していますが，うまくいきません．