質問編集履歴
6
質問変更
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
|
1
|
+
列の内容が同じDataFrame同士を連結する方法
|
test
CHANGED
@@ -1,9 +1,51 @@
|
|
1
|
+
pandasで同じ列同士の2つのdataframe(df1、df2)を連結して、新しいDataFrame(dff)を作りたいのですが、列の内容が同じ(idが同じもの同士)を連結するにはどのようにすればいいのでしょうか?
|
2
|
+
|
1
|
-
|
3
|
+
concatを使ってもうまくいきません。ご教授お願いします
|
2
4
|
|
3
5
|
|
4
6
|
|
7
|
+
```python
|
8
|
+
|
9
|
+
# df1
|
10
|
+
|
11
|
+
karin_id, kingaku, birth,
|
12
|
+
|
5
|
-
|
13
|
+
3564 2000 2014
|
14
|
+
|
15
|
+
2536 3000 1994
|
16
|
+
|
17
|
+
6453 3200 1996
|
18
|
+
|
19
|
+
3245 1000 1995
|
6
20
|
|
7
21
|
|
8
22
|
|
23
|
+
|
24
|
+
|
25
|
+
# df2
|
26
|
+
|
27
|
+
karin_id, pop, tag,
|
28
|
+
|
29
|
+
3564 0 4
|
30
|
+
|
31
|
+
2536 26 9
|
32
|
+
|
33
|
+
6453 34 3
|
34
|
+
|
35
|
+
3245 4 4
|
36
|
+
|
37
|
+
|
38
|
+
|
39
|
+
# dff(df1とdf2を連結)
|
40
|
+
|
9
|
-
|
41
|
+
karin_id, kingaku, birth, pop, tag
|
42
|
+
|
43
|
+
3564 2000 2014 0 4
|
44
|
+
|
45
|
+
2536 3000 1994 26 9
|
46
|
+
|
47
|
+
6453 3200 1996 34 3
|
48
|
+
|
49
|
+
3245 1000 1995 4 4
|
50
|
+
|
51
|
+
```
|
5
質問変更
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
|
1
|
+
CTR率に関係する要因(特徴量)について
|
test
CHANGED
@@ -1,55 +1,9 @@
|
|
1
|
-
|
1
|
+
CTRの予測の特徴量で
|
2
|
-
|
3
|
-
pandasで以下の列名のDataFrame(df)があります
|
4
|
-
|
5
|
-
```python
|
6
|
-
|
7
|
-
#df
|
8
|
-
|
9
|
-
'rate','user', 'age'
|
10
|
-
|
11
|
-
0, 2 u1 22
|
12
|
-
|
13
|
-
1, 5 u2 13
|
14
|
-
|
15
|
-
2, 3 u 33
|
16
2
|
|
17
3
|
|
18
4
|
|
19
|
-
```
|
20
|
-
|
21
|
-
この3つの列で可能な限りの列名の組み合わせのlistを作りたいのですが、そのようにすればいいでしょうか?
|
22
|
-
|
23
|
-
数学である[順列](https://keisan.casio.jp/exec/system/1161228812)で
|
24
|
-
|
25
|
-
|
5
|
+
**・userが公告をクリックする衝動・要因**
|
26
6
|
|
27
7
|
|
28
8
|
|
29
|
-
|
9
|
+
を使いたいのですが、何か参考になるもの、該当しそうなものをご存知でしたら教えていただけないでしょうか?
|
30
|
-
|
31
|
-
|
32
|
-
|
33
|
-
---
|
34
|
-
|
35
|
-
**例 : 下のような列名の全ての組み合わせ(A~D)のlistの作成**
|
36
|
-
|
37
|
-
|
38
|
-
|
39
|
-
3つの列なら全ての組み合わせは、
|
40
|
-
|
41
|
-
```python
|
42
|
-
|
43
|
-
candidate_columns=[
|
44
|
-
|
45
|
-
['rate', 'age'],#A
|
46
|
-
|
47
|
-
['rate', 'user'],#B
|
48
|
-
|
49
|
-
['user', 'age'],#C
|
50
|
-
|
51
|
-
['rate', 'age', 'user'],#D
|
52
|
-
|
53
|
-
]
|
54
|
-
|
55
|
-
```
|
4
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -18,7 +18,7 @@
|
|
18
18
|
|
19
19
|
```
|
20
20
|
|
21
|
-
この
|
21
|
+
この3つの列で可能な限りの列名の組み合わせのlistを作りたいのですが、そのようにすればいいでしょうか?
|
22
22
|
|
23
23
|
数学である[順列](https://keisan.casio.jp/exec/system/1161228812)で
|
24
24
|
|
3
質問変更
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
|
1
|
+
可能な限りの特徴量の組み合わせを作る方法
|
test
CHANGED
@@ -1 +1,55 @@
|
|
1
|
+
質問変更申し訳ありません。
|
2
|
+
|
3
|
+
pandasで以下の列名のDataFrame(df)があります
|
4
|
+
|
5
|
+
```python
|
6
|
+
|
7
|
+
#df
|
8
|
+
|
9
|
+
'rate','user', 'age'
|
10
|
+
|
11
|
+
0, 2 u1 22
|
12
|
+
|
13
|
+
1, 5 u2 13
|
14
|
+
|
15
|
+
2, 3 u 33
|
16
|
+
|
17
|
+
|
18
|
+
|
19
|
+
```
|
20
|
+
|
1
|
-
|
21
|
+
この4つで可能な限りの列名の組み合わせのlistを作りたいのですが、そのようにすればいいでしょうか?
|
22
|
+
|
23
|
+
数学である[順列](https://keisan.casio.jp/exec/system/1161228812)で
|
24
|
+
|
25
|
+
3C2+3C3=3+1=4の組み合わせの計算ででた組み合わせのlistを作成する感じです
|
26
|
+
|
27
|
+
|
28
|
+
|
29
|
+
良い方法がありましたらご教授いただけないでしょうか?
|
30
|
+
|
31
|
+
|
32
|
+
|
33
|
+
---
|
34
|
+
|
35
|
+
**例 : 下のような列名の全ての組み合わせ(A~D)のlistの作成**
|
36
|
+
|
37
|
+
|
38
|
+
|
39
|
+
3つの列なら全ての組み合わせは、
|
40
|
+
|
41
|
+
```python
|
42
|
+
|
43
|
+
candidate_columns=[
|
44
|
+
|
45
|
+
['rate', 'age'],#A
|
46
|
+
|
47
|
+
['rate', 'user'],#B
|
48
|
+
|
49
|
+
['user', 'age'],#C
|
50
|
+
|
51
|
+
['rate', 'age', 'user'],#D
|
52
|
+
|
53
|
+
]
|
54
|
+
|
55
|
+
```
|
2
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
|
1
|
+
レコメンドでCTRを予測する意味について
|
test
CHANGED
@@ -1,21 +1 @@
|
|
1
|
-
レコメンドでCTR(クリック率)を予測するアルゴリズムが
|
1
|
+
kaggleとかのレコメンドのコンペでCTR(クリック率)を予測するアルゴリズムが人気なのですが、CTRを予測することが何故レコメンドに有効なのでしょうか?
|
2
|
-
|
3
|
-
|
4
|
-
|
5
|
-
trainデータでindexを広告にして、広告ごとのユーザー情報(x)とCTR率(y)を学習させます。
|
6
|
-
|
7
|
-
|
8
|
-
|
9
|
-
testのステップで同様にユーザー情報(x)を入れてCTR率(y)を予測したとします。
|
10
|
-
|
11
|
-
このときCTR率が予測されただけでXのユーザーに対して、なぜレコメンドができるというロジックになるのでしょうか?
|
12
|
-
|
13
|
-
|
14
|
-
|
15
|
-
CTRを予測しただけでは、何を持って「おすすめ」の広告をレコメンド表示すればいいのかわかりません。ユーザーベースみたいに類似度の高い順ならわかるのですが、CTRを算出しただけではレコメンドとは無関係な感じがするのですが、、
|
16
|
-
|
17
|
-
|
18
|
-
|
19
|
-
なぜCTRを予測してパーソナライズなレコメンドができるのでしょうか?
|
20
|
-
|
21
|
-
ご教授お願いします
|
1
内容修正
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
CTR予測のレコメンド
|
1
|
+
なぜCTR予測のアルゴリズムがレコメンドとして機能するかについて
|
test
CHANGED
@@ -1,31 +1,21 @@
|
|
1
|
-
レコメンドでCTR(クリック率)を予測するアルゴリズムがkaggleで人気なのですが、
|
1
|
+
レコメンドでCTR(クリック率)を予測するアルゴリズムがkaggleで人気なのですが、CTRを予測することでなぜパーソナライズなレコメンドができるのでしょうか?
|
2
2
|
|
3
3
|
|
4
4
|
|
5
|
-
**メインの質問**
|
6
|
-
|
7
|
-
特に、CTRを予測して、
|
8
|
-
|
9
|
-
|
5
|
+
trainデータでindexを広告にして、広告ごとのユーザー情報(x)とCTR率(y)を学習させます。
|
10
|
-
|
11
|
-
・レコメンド表示する広告はどのように決定するのか
|
12
|
-
|
13
|
-
の点について仕組みがわかりません。
|
14
6
|
|
15
7
|
|
16
8
|
|
17
|
-
|
9
|
+
testのステップで同様にユーザー情報(x)を入れてCTR率(y)を予測したとします。
|
10
|
+
|
11
|
+
このときCTR率が予測されただけでXのユーザーに対して、なぜレコメンドができるというロジックになるのでしょうか?
|
18
12
|
|
19
13
|
|
20
14
|
|
21
|
-
|
15
|
+
CTRを予測しただけでは、何を持って「おすすめ」の広告をレコメンド表示すればいいのかわかりません。ユーザーベースみたいに類似度の高い順ならわかるのですが、CTRを算出しただけではレコメンドとは無関係な感じがするのですが、、
|
22
16
|
|
23
17
|
|
24
18
|
|
25
|
-
|
19
|
+
なぜCTRを予測してパーソナライズなレコメンドができるのでしょうか?
|
26
20
|
|
27
|
-
|
28
|
-
|
29
|
-
|
30
|
-
|
31
|
-
|
21
|
+
ご教授お願いします
|