質問編集履歴

2

追記

2019/04/17 04:04

投稿

_Victorique__
_Victorique__

スコア1392

test CHANGED
File without changes
test CHANGED
@@ -117,3 +117,29 @@
117
117
  この場合、カラム全部を指定すれば検索できるとは思うのですが、全部指定するのはスマートじゃないと思っています。
118
118
 
119
119
  もっとスマートに比較して検索する方法はありますでしょうか?
120
+
121
+
122
+
123
+ ### 追記2
124
+
125
+ ・データフレームM, N
126
+
127
+ ・データ数
128
+
129
+ M, N共に百万程度(数は一致しない)
130
+
131
+ ・カラム数
132
+
133
+ M = 7
134
+
135
+ N = 10
136
+
137
+ N(0~5のカラム) ≡ N(0~5のカラム) 完全一致でペアとみなす
138
+
139
+ ・検索と結合
140
+
141
+ Mを元にNを走査し、マッチするものをマージして新しいデータフレームに追加
142
+
143
+
144
+
145
+ 追記にも書きましたが、完全一致のスマートな書き方はありますでしょうか?

1

追記

2019/04/17 04:04

投稿

_Victorique__
_Victorique__

スコア1392

test CHANGED
File without changes
test CHANGED
@@ -75,3 +75,45 @@
75
75
  上記を満たす、条件にmatchする際に最適なメソッドと結合の際に最適なメソッドはどれが良いでしょうか?
76
76
 
77
77
  よろしくお願いします。
78
+
79
+
80
+
81
+
82
+
83
+ ### 追記
84
+
85
+ 例えば以下のデータフレームがあるとします。
86
+
87
+ ```python
88
+
89
+ df1
90
+
91
+ # 0 1 2 3 4 5 6
92
+
93
+ # 0 Jack Male USA 20 mucsician rock movie
94
+
95
+
96
+
97
+ df2
98
+
99
+ # 0 1 2 3 4 5 6
100
+
101
+ # 0 Jack Male USA 20 mucsician rock NaN
102
+
103
+ # 1 Mary Female Canada 24 unemployed game NaN
104
+
105
+ # 2 Marco None Italy 25 designer fashion NaN
106
+
107
+ # 3 Isabel Female France 24 actress shopping NaN
108
+
109
+ ```
110
+
111
+
112
+
113
+ 比較の方法としては0~5までのカラムを比較して一致しているものを全部取り出すという操作がしたいです。
114
+
115
+ 上記の例だと行インデックス0が条件に一致します(一つだけとは限らない)
116
+
117
+ この場合、カラム全部を指定すれば検索できるとは思うのですが、全部指定するのはスマートじゃないと思っています。
118
+
119
+ もっとスマートに比較して検索する方法はありますでしょうか?