質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

2回答

5152閲覧

Pandas 2つのdf間の一致(部分一致)を確認し、結果をdfに追記したい

kuma07

総合スコア9

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2021/07/17 02:23

Python 初心者です。

【実現したいこと】
2つのデータフレームがあります。いずれも、同じ要素(date,items,sales)から構成されてます。
1つのデータフレームdf1(返品リスト)の各行の「date,items」について、もう1つのデータフレームdf2(売上リスト)に該当する行があるかを確認したいです。
確認の結果をdf1に列を追加して’True’、’False’を記載したいと考えております。

※df1の各行の「date,items」と一致する行がdf2に含まれているかを確認し、結果をdf1に記載したいです。

【実施したこと】
df1とdf2の一致をfor 文で実施できないかと思いました。
この方法だと一致の有無は、確認できそうですが、結果をdf1に反映する方法がわからないです
(例だと、Cは8つの要素になってしまうため)
※コードのイメージですとdf1の1行目はTrue 、2行目はFalseを追加するようにできないかと考えております

import numpy as np import pandas as pd data1={ 'date':['21/07/02','21/07/15'], 'items':['A','B'], 'sales':[-100,-300] } df1=pd.DataFrame(data1,columns=["date","items","sales"]) data2={ 'date':['21/07/02','21/07/02','21/07/07','21/07/15'], 'items':['A','B','A','C'], 'sales':[100,300,150,300] } df2=pd.DataFrame(data2,columns=["date","items","sales"]) c=[] for i,row_df1 in df1[["date","items"]].iterrows(): #print(i,row_df1) for j,row_df2 in df2[["date","items"]].iterrows(): #print(j,row_df2) if (row_df1==row_df2).all() : c.append(True) #break else: c.append(False)

ネットなどを探したのですがうまく発見できなかったです。
改善方法等についてアドバイスをいただけますと幸いです。
よろしくお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

返品リストに売上リストを左結合すると行の有無が得られるので、その結果を列として追加すればよいです。

Python

1import numpy as np 2import pandas as pd 3 4data1={ 5 'date':['21/07/02','21/07/15'], 6 'items':['A','B'], 7 'sales':[-100,-300] 8 } 9df1=pd.DataFrame(data1,columns=["date","items","sales"]) 10 11data2={ 12 'date':['21/07/02','21/07/02','21/07/07','21/07/15'], 13 'items':['A','B','A','C'], 14 'sales':[100,300,150,300] 15 } 16 17df2=pd.DataFrame(data2,columns=["date","items","sales"]) 18 19df = pd.merge(df1, df2, on=['date','items'], how='left') 20 21df1['exists'] = ~df['sales_y'].isnull() 22print(df1) 23# date items sales exists 24#0 21/07/02 A -100 True 25#1 21/07/15 B -300 False

投稿2021/07/17 03:09

can110

総合スコア38341

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

kuma07

2021/07/17 09:33

ありがとうございます。 mergeを利用して考えるまで至らなかったです。 大変勉強になりました。 またよろしくお願いいたします。
guest

0

ベストアンサー

python

1import numpy as np 2import pandas as pd 3 4data1={ 5 'date':['21/07/02','21/07/15'], 6 'items':['A','B'], 7 'sales':[-100,-300] 8 } 9df1=pd.DataFrame(data1,columns=["date","items","sales"]) 10 11data2={ 12 'date':['21/07/02','21/07/02','21/07/07','21/07/15'], 13 'items':['A','B','A','C'], 14 'sales':[100,300,150,300] 15 } 16 17df2=pd.DataFrame(data2,columns=["date","items","sales"]) 18 19""" 20df1: 21 22date items sales 230 21/07/02 A -100 241 21/07/15 B -300 25 26df2: 27 28date items sales 290 21/07/02 A 100 301 21/07/02 B 300 312 21/07/07 A 150 323 21/07/15 C 300 33""" 34 35df2.merge(df1, how='outer', on=['date','items']).assign( 36 match=lambda x: x.sales_x + x.sales_y == 0 37) 38 39""" 40date items sales_x sales_y match 410 21/07/02 A 100.0 -100.0 True 421 21/07/02 B 300.0 NaN False 432 21/07/07 A 150.0 NaN False 443 21/07/15 C 300.0 NaN False 454 21/07/15 B NaN -300.0 False 46"""

※df1の各行の「date,items」と一致する行がdf2に含まれているかを確認し、結果をdf1に記載したいです。
がよくわかりませんでした。

python

1df1.merge(df2, how='outer', on=['date','items']).assign( 2 sales = lambda x: x.sales_x, 3 match = lambda x: x.sales_y > 0 4).query("~sales_x.isna()",engine='python').drop(['sales_x','sales_y'],axis=1) 5 6""" 7date items sales match 80 21/07/02 A -100.0 True 91 21/07/15 B -300.0 False 10"""

であれば、そのまま戻してあげればいいと思います。

投稿2021/07/17 02:59

toshikawa

総合スコア388

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

kuma07

2021/07/17 09:32

ありがとうございます。 大変わかりやすいご説明です。 ほんとにやりたかったことが最初のコードで大変助かりました。 引き続きよろしくお願いいたします。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問