質問編集履歴

1

2018/10/25 15:34

投稿

trafalbad
trafalbad

スコア303

test CHANGED
@@ -1 +1 @@
1
- 複雑なモデルアンサンブル学習(stacking)の方法
1
+ 大量カテゴリ変数を量的変数に加工する方法
test CHANGED
@@ -1,75 +1,13 @@
1
- [こサイト](http://segafreder.hatenablog.com/entry/2016/05/26/232728)を参考にしてアンブル学習(stacking)しようと思ってます。
1
+ 機械学習特徴量エンジニグで大量のブラidのですが、全部をダミー変数にする多すぎるので、なるべく量的変数に変換したいと考えます。
2
2
 
3
3
 
4
4
 
5
- stage 0入れるモデルとして
5
+ 一案としてはブランドidと対のブランド名をword2vec類似度に変換して量的変数化する方法を考えています。
6
6
 
7
7
 
8
8
 
9
- ①xgboost([こサイト](https://github.com/bakuratozoku/segment_classification_by_xgbost/blob/master/xgboost.ipynb)のxgboost
9
+ 何か大量カテゴリ変数(idを量的変数に変換する方法でいい方法はないでしょうか?
10
10
 
11
11
 
12
12
 
13
- ②kerasで作ったニューラルネットワーク(NN)
14
-
15
- ```python
13
+ ご教授お願いします
16
-
17
- model = Sequential()
18
-
19
- model.add(Dense(1024, input_dim=5, activation='relu'))
20
-
21
- model.add(Dense(512, activation='relu'))
22
-
23
- model.add(Dense(256, activation='relu'))
24
-
25
- model.add(Dense(classes, activation='softmax'))
26
-
27
- model.compile(optimizer='rmsprop',
28
-
29
- loss='categorical_crossentropy',
30
-
31
- metrics=['accuracy'])
32
-
33
- model.fit(train_x,train_y, epochs=10, batch_size=bsize)
34
-
35
- ```
36
-
37
- ③[Factorization Machines(libFM)](https://github.com/oreilly-japan/ml-at-work/blob/master/chap07/Movie_recommendation.ipynb)
38
-
39
-
40
-
41
- のモデルをStage 0のモデルに挿入したいのですが、下記のようにモデルの本体を入れる入れ方でいいのでしょうか?
42
-
43
- 特にkerasのNNの入れ方があってるかわかりません。ご教授お願いします
44
-
45
-
46
-
47
- ---
48
-
49
- **入れるモデルの形式**
50
-
51
- ①xgboost→ best_paramsを入れたxgb.train()
52
-
53
- xgb.train(best_params, train_xd, num_boost_round=100)
54
-
55
-
56
-
57
- ②kerasのNN=> model.compile以降のmodel
58
-
59
-
60
-
61
- ③libFM => mcmc.FMRegression(n_iter=n_iter, rank=rank, random_state=seed)
62
-
63
-
64
-
65
- ```python
66
-
67
- # Stage 0のモデルたち
68
-
69
- clfs = [xgb.train(best_params, train_xd, num_boost_round=100),
70
-
71
- model, mcmc.FMRegression(n_iter=n_iter, rank=rank, random_state=seed)
72
-
73
- ]
74
-
75
- ```