質問編集履歴

再度　前提と修正しました

2021/07/24 10:39

投稿

スコア24

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -18,11 +18,12 @@
 追加ファイル.csv
 (りんご、バナナが元のファイルと重複している。
+りんごのように元データでりんご、追加データでアップルと商品名が異なる場合もあるのがJANコードが重複していればスキップしたい（行の完全一致ではないので、pandas のdrop_duplicatesでは難しいかも・・）
 |列4（商品名）|列15(JANコード）|
 |:--|:--:|
 |きゅうり|5555555|
-|りんご|111111|
+|アップル|111111|
 |バナナ|バーコードなし|
 |なす|666666|

自分で実行したコードを修正しました

2021/07/24 10:39

投稿

スコア24

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -59,21 +59,18 @@
 ```python
 import pandas as pd
-df2 = pd.read_csv("./元データ.csv", encoding="cp932",header=None)
+df1 = pd.read_csv("./元データ.csv", encoding="cp932",header=None)
-df1 = pd.read_csv("./追加データ.csv", encoding="cp932",header=None)
+df2 = pd.read_csv("./追加データ.csv", encoding="cp932",header=None)
 import csv
 save_csv='./元データ.csv'
-for row in df2.iterrows() : #←　df2.iloc[:, 4]　とdf2.iloc[:, 15]を参照したいのですがどうやって取り出せばいいのかわかりません
-    for row2 in df1.iterrows()  :
+for x in df2.iloc[:, 15]:
-        if row in row2:
+    if x in df1.iloc[:, 15]:
-        print(row) ←　重複してCSVに追記されないデータを出力
-            continue
+       continue
     else:
-　　　　　#元データに重複する値（列4、列15参照）がない行のみ、追加ファイルの行を元エータに追記する
-        with open(save_csv, 'a',encoding ='cp932') as f:
+        with open(df1, 'a',encoding ='cp932') as f:
             writer = csv.writer(f)
-            writer.writerow(df2.iterrows())
+            writer.writerow(df2.iterrows())#xが含まれる行を1行ずつ取り出す方法がわからない
 ```

説明文の追記

2021/07/24 10:34

投稿

スコア24

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -29,6 +29,9 @@
 ##追記後のファイルイメージ
 結合したい（元ファイルに追記したい）
 きゅうり、なす　の重複していない行のみを元ファイルに追記したい（順次保存）
+バーコードで重複チェックだけだと
+バーコードが存在しないデータ（バナナ）が重複する可能性があるため
+名前での一致でも重複したデータはスキップしたいです
 |列4（商品名）|列15(JANコード）|
 |:--|:--:|
 |りんご|#111111|

コード修正

2021/07/24 05:02

投稿

スコア24

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -72,5 +72,5 @@
 　　　　　#元データに重複する値（列4、列15参照）がない行のみ、追加ファイルの行を元エータに追記する
         with open(save_csv, 'a',encoding ='cp932') as f:
             writer = csv.writer(f)
-            writer.writerow(save_csv)
+            writer.writerow(df2.iterrows())
 ```