質問編集履歴

内容の明確化

2019/06/20 12:33

投稿

Danrussia

スコア44

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -1,16 +1,216 @@
-### 前提・実現したいこと
-Python3内で複数のファイルを統合する際に、統合したファイルに特定のColmunsが
-ある場合とない場合で処理(結合方法を変える)を変えるコードを実装しようと思っています。
-(以下二つのサイトを参考http://nekoyukimmm.hatenablog.com/entry/2015/04/10/133917,https://teratail.com/questions/191326)
-上記のサイト2つを参考に自分で実装を試みたのですが、該当のソースコード3行目で文法的なエラーが出てしまい、解決できなかったので、Teratailの方で質問させて頂きました。
+### 前提・実現したい事
+Pythonのmerge関数とif文を用いてデータ構造ごとにmergeの処理を変えるプログラムを実装したいと思っています。
+デーダフレイム(df2)に"品種名"というコラムがある場合には、この"品種名"というコラムを削除したうえで、指定した結合をする、ない場合はそのまま結合する。というようなコードを実装したいのですが、下記の実装例①はちゃんと実装できたのですが、②の場合で上手く実装できません。
+### 　①　df1とdf2の結合の際にNaN値が発生するが、コラムは全て一致する場合
+```python3
+df1 = pd.DataFrame({'Label':['img061c.jpg', 'img061c.jpg', 'img061c.jpg',...,'img062c.jpg','img062c.jpg','img062c.jpg',...,'img063c.jpg','img063c.jpg','img063c.jpg',...,'img064c.jpg','img064c.jpg','img064c.jpg']})
+#  Label
+#  img061c
+#  img061c
+#  img061c
+#  ....
+#  img062c
+#  img062c
+#  img062c
+#  ....
+#  img063c
+#  img063c
+#  img063c
+#  ....
+#  img064c
+#  img064c
+#  img064c
+```
+```python3
+df2 = pd.DataFrame({'PictureNumber':['img061c.jpg', 'img062c.jpg', 'img063c.jpg',"img067c.jpg"], 'SumpleNumber':['くるみ豆', '金持ち豆', '秘伝豆',"きさらぎ"], 'BeenNumber':['B2', 'B3', 'B4',"B8"]})
+#   PictureNumber   SumpleNunber   BeenNumber
+#   img061c         くるみ豆        B2
+#   img062c         金持ち豆        B3
+#   img063c         秘伝豆          B4
+#   img067c         きさらぎ        B8
+```
+```python3
+def Merging (df1,df2):
+    df3 = pd.merge(df1, df2, left_on='Label', right_on='PictureNumber', how='left').drop('PictureNumber', axis=1)
+    if df3['Sumple'].isnull().any():
+        df3 = pd.merge(df1, df2, left_on='Label', right_on='PictureNumber', how='outer')
+    return df3
+     Label         PictureNumber   SumpleNumber BeenNumber
+#    img061c.jpg   img061c.jpg     くるみ豆         B2
+#    img061c.jpg   img061c.jpg     くるみ豆         B2
+#    img061c.jpg   img061c.jpg     くるみ豆         B2
+#    ....          ....            ....            ....
+#    img062c.jpg   img062c.jpg     金持ち豆         B3
+#    img062c.jpg   img062c.jpg     金持ち豆         B3
+#    img062c.jpg   img062c.jpg     金持ち豆         B3
+#    ....          ....             ....            ....
+#    img063c.jpg   img063c.jpg     秘伝豆         　B4
+#    img063c.jpg   img063c.jpg     秘伝豆         　B4
+#    img063c.jpg   img063c.jpg     秘伝豆         　B4
+#    ....          ....           ....            ....
+#    img064c.jpg　 NaN            NaN              B7
+#    ....          ....           ....            ....
+#    NaN	       img067c.jpg	きさらぎ	      B8
+```
+### 　②　df1とdf2の結合の際にNaN値が発生し、コラムが一致しない場合
+```python3
+df1 = pd.DataFrame({'Label':['img061c.jpg', 'img061c.jpg', 'img061c.jpg',...,'img062c.jpg','img062c.jpg','img062c.jpg',...,'img063c.jpg','img063c.jpg','img063c.jpg',...,'img064c.jpg','img064c.jpg','img064c.jpg']})
+#  Label
+#  img061c
+#  img061c
+#  img061c
+#  ....
+#  img062c
+#  img062c
+#  img062c
+#  ....
+#  img063c
+#  img063c
+#  img063c
+#  ....
+#  img064c
+#  img064c
+#  img064c
+```
+```python3
+df2 = pd.DataFrame({'PictureNumber':['img061c.jpg', 'img062c.jpg', 'img063c.jpg',"img067c.jpg"], 'SumpleNumber':['くるみ豆', '金持ち豆', '秘伝豆',"きさらぎ"], 'BeenNumber':['B2', 'B3', 'B4',"B8"]})
+#   PictureNumber   SumpleNunber   BeenNumber　品種名
+#   img061c         くるみ豆        B2
+#   img062c         金持ち豆        B3
+#   img063c         秘伝豆          B4
+#   img067c         きさらぎ        B8
+```
+```python3
+def Merging (df1,df2):
+    df3 = pd.merge(df1, df2, left_on='Label', right_on='PictureNumber', how='left').drop('PictureNumber', axis=1)
+    if df3['Sumple'].isnull().any()."品種名" in df3.columns:
+        df3 = pd.merge(df1, df2, left_on='Label', right_on='PictureNumber', how='outer').drop("品種名",axis=1).drop('PictureNumber', axis=1)
+    elif df3['Sumple'].isnull().any()."品種名" not in df3.columns:
+        df3 = pd.merge(df1, df2, left_on='Label', right_on='PictureNumber', how='outer').drop('PictureNumber', axis=1)
+    return df3
+     Label         PictureNumber   SumpleNumber BeenNumber
+#    img061c.jpg   img061c.jpg     くるみ豆         B2
+#    img061c.jpg   img061c.jpg     くるみ豆         B2
+#    img061c.jpg   img061c.jpg     くるみ豆         B2
+#    ....          ....            ....            ....
+#    img062c.jpg   img062c.jpg     金持ち豆         B3
+#    img062c.jpg   img062c.jpg     金持ち豆         B3
+#    img062c.jpg   img062c.jpg     金持ち豆         B3
+#    ....          ....             ....            ....
+#    img063c.jpg   img063c.jpg     秘伝豆         　B4
+#    img063c.jpg   img063c.jpg     秘伝豆         　B4
+#    img063c.jpg   img063c.jpg     秘伝豆         　B4
+#    ....          ....           ....            ....
+#    img064c.jpg　 NaN            NaN              B7
+#    ....          ....           ....            ....
+#    NaN	       img067c.jpg	きさらぎ	     B8
+```
 ### 発生している問題・エラーメッセージ
@@ -26,7 +226,7 @@
 ```
-### 該当のソースコード
+### 実際に書いたコード
 ```Python3
@@ -34,17 +234,23 @@
     df3 = pd.merge(df1, df2, left_on='Label', right_on='PictureNumber', how='left').drop('PictureNumber', axis=1)
+    if df3['Sumple'].isnull().any()."品種名" in df3.columns:
+        df3 = pd.merge(df1, df2, left_on='Label', right_on='PictureNumber', how='outer').drop("品種名",axis=1).drop('PictureNumber', axis=1)
-    if df3['Sumple'].isnull().any()."品種名" not in df3.columns:
+    elif df3['Sumple'].isnull().any()."品種名" not in df3.columns:
-        df3 = pd.merge(df1, df2, left_on='Label', right_on='PictureNumber', how='outer').drop("品種名",axis=1).drop('PictureNumber', axis=1).rename(columns={'Sumple':'品種名'})
-    elif df3['Sumple'].isnull().any()."品種名"in df3.columns:
-        df3 = pd.merge(df1, df2, left_on='Label', right_on='PictureNumber', how='outer')
+        df3 = pd.merge(df1, df2, left_on='Label', right_on='PictureNumber', how='outer').drop('PictureNumber',
-    return df3
-```
+```
+### 参考にしたサイト
+http://nekoyukimmm.hatenablog.com/entry/2015/04/10/133917
+https://teratail.com/questions/191326
 ### 補足情報（FW/ツールのバージョンなど）

内容の明確化

2019/06/20 12:33

投稿

Danrussia

スコア44

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -34,7 +34,7 @@
     df3 = pd.merge(df1, df2, left_on='Label', right_on='PictureNumber', how='left').drop('PictureNumber', axis=1)
-    if df3['Sumple'].isnull().any()."品種名" in df3.columns:
+    if df3['Sumple'].isnull().any()."品種名" not in df3.columns:
         df3 = pd.merge(df1, df2, left_on='Label', right_on='PictureNumber', how='outer').drop("品種名",axis=1).drop('PictureNumber', axis=1).rename(columns={'Sumple':'品種名'})