defを使ったときにdefを使わないときと同様の結果を得たい。
患者さんの手術データと検査のデータがあり、それらを結合するコードを作成しています。これらを紐づけるのは患者さんに特有のIDと手術日と検査日です。手術日と検査日は同じ日ではなく、検査日は手術の前90日から手術日まで、ということでこれらを結合します。IDごとに処理を行って、pandus.concatを使用して、手術データと同じ数のdataflameにします。
def構文を使わずに行うとうまくいくのですが、def構文を使うと、concatの最後の結果だけとなります。
=== def構文無し ===
for i in s_id:
df_s = df_ope2 [df_ope2 ['patient_ID'] == i]
for j in range (len(df_s)): s_date = df_s.iloc[j, 1] df_p=df_patho_sel2 [df_patho_sel2 ['patient_ID'] == i] for k in range(len(df_p)): p_date = df_p.iloc[k, 1] #日付は必ず2列目 days = (p_date - s_date).days if 0<=days<5: df_d = pd.merge (df_s.iloc[[j], :], df_p.iloc[[k], :], on='patient_ID') df=pd.concat([df,df_d])
df
-> この結果1000行以上のdataframeが作成されます。
=== def構文あり ===
df=pd.DataFrame ()
def add_pm (df1=None, df1_id=None, df4=None, range1=None, range2=None): #df1は結合される側のdf、
if df1 is None or df1_id is None or df4 is None or range1 is None or range2 is None: raise Exception('Error: Invalid value!!') global df df=pd.DataFrame () df1_unique_id = df1 [df1_id].unique() for i in df1_unique_id: df2 = df1 [df1 [df1_id] == i] #df2は各i (症例) のdf1におけるdf (複数行あり)、idは必ず1列目 (0) for j in range (len(df2)): #df2にある行の数だけ繰り返す、日付は必ず2列目 df1_date = df2.iloc[j, 1] df3=df4 [df4 [df1_id] == i] #df4: df1に結合するデータ (例えば採血) for k in range(len(df3)): df4_date = df3.iloc[k, 1] #日付は必ず2列目 days = (df4_date - df1_date).days if range1 <= days <= range2: df5 = pd.merge (df2.iloc[[j], :], df3.iloc[[k], :], on=df1_id) # print(df5) df=pd.concat([df,df5])
add_pm (df1=df_ope2, df1_id='patient_ID', df4=df_patho_sel2, range1=0, range2=5)
df
-> 上記の1000行以上のdataframeのうち最後の行だけが帰ってきます。
おそらく、globalの使い方に問題がある気がしますが、問題点を教えていただけたらありがたいです。
よろしくお願いいたします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。