質問編集履歴
2
追記
test
CHANGED
File without changes
|
test
CHANGED
@@ -117,3 +117,29 @@
|
|
117
117
|
この場合、カラム全部を指定すれば検索できるとは思うのですが、全部指定するのはスマートじゃないと思っています。
|
118
118
|
|
119
119
|
もっとスマートに比較して検索する方法はありますでしょうか?
|
120
|
+
|
121
|
+
|
122
|
+
|
123
|
+
### 追記2
|
124
|
+
|
125
|
+
・データフレームM, N
|
126
|
+
|
127
|
+
・データ数
|
128
|
+
|
129
|
+
M, N共に百万程度(数は一致しない)
|
130
|
+
|
131
|
+
・カラム数
|
132
|
+
|
133
|
+
M = 7
|
134
|
+
|
135
|
+
N = 10
|
136
|
+
|
137
|
+
N(0~5のカラム) ≡ N(0~5のカラム) 完全一致でペアとみなす
|
138
|
+
|
139
|
+
・検索と結合
|
140
|
+
|
141
|
+
Mを元にNを走査し、マッチするものをマージして新しいデータフレームに追加
|
142
|
+
|
143
|
+
|
144
|
+
|
145
|
+
追記にも書きましたが、完全一致のスマートな書き方はありますでしょうか?
|
1
追記
test
CHANGED
File without changes
|
test
CHANGED
@@ -75,3 +75,45 @@
|
|
75
75
|
上記を満たす、条件にmatchする際に最適なメソッドと結合の際に最適なメソッドはどれが良いでしょうか?
|
76
76
|
|
77
77
|
よろしくお願いします。
|
78
|
+
|
79
|
+
|
80
|
+
|
81
|
+
|
82
|
+
|
83
|
+
### 追記
|
84
|
+
|
85
|
+
例えば以下のデータフレームがあるとします。
|
86
|
+
|
87
|
+
```python
|
88
|
+
|
89
|
+
df1
|
90
|
+
|
91
|
+
# 0 1 2 3 4 5 6
|
92
|
+
|
93
|
+
# 0 Jack Male USA 20 mucsician rock movie
|
94
|
+
|
95
|
+
|
96
|
+
|
97
|
+
df2
|
98
|
+
|
99
|
+
# 0 1 2 3 4 5 6
|
100
|
+
|
101
|
+
# 0 Jack Male USA 20 mucsician rock NaN
|
102
|
+
|
103
|
+
# 1 Mary Female Canada 24 unemployed game NaN
|
104
|
+
|
105
|
+
# 2 Marco None Italy 25 designer fashion NaN
|
106
|
+
|
107
|
+
# 3 Isabel Female France 24 actress shopping NaN
|
108
|
+
|
109
|
+
```
|
110
|
+
|
111
|
+
|
112
|
+
|
113
|
+
比較の方法としては0~5までのカラムを比較して一致しているものを全部取り出すという操作がしたいです。
|
114
|
+
|
115
|
+
上記の例だと行インデックス0が条件に一致します(一つだけとは限らない)
|
116
|
+
|
117
|
+
この場合、カラム全部を指定すれば検索できるとは思うのですが、全部指定するのはスマートじゃないと思っています。
|
118
|
+
|
119
|
+
もっとスマートに比較して検索する方法はありますでしょうか?
|