teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

1

2018/10/25 15:34

投稿

trafalbad
trafalbad

スコア303

title CHANGED
@@ -1,1 +1,1 @@
1
- 複雑なモデルアンサンブル学習(stacking)の方法
1
+ 大量カテゴリ変数を量的変数に加工する方法
body CHANGED
@@ -1,38 +1,7 @@
1
- [こサイト](http://segafreder.hatenablog.com/entry/2016/05/26/232728)を参考にしてアンサンル学習(stacking)しようと思ってます。
1
+ 機械学習特徴量エンジニグで大量のランドidのですが、全部をダミー変数にする多すぎるので、なるべく量的変数に変換したいと考えます。
2
2
 
3
- stage 0で入れるモデルとして
3
+ 一案としてはブランドidと対のブランド名をword2vecで類似度に変換して量的変数化する方法を考えています。
4
4
 
5
- ①xgboost([こサイト](https://github.com/bakuratozoku/segment_classification_by_xgbost/blob/master/xgboost.ipynb)のxgboost
5
+ 何か大量カテゴリ変数(idを量的変数に変換する方法でいい方法はないでしょうか?
6
6
 
7
- ②kerasで作ったニューラルネットワーク(NN)
8
- ```python
7
+ ご教授お願いします
9
- model = Sequential()
10
- model.add(Dense(1024, input_dim=5, activation='relu'))
11
- model.add(Dense(512, activation='relu'))
12
- model.add(Dense(256, activation='relu'))
13
- model.add(Dense(classes, activation='softmax'))
14
- model.compile(optimizer='rmsprop',
15
- loss='categorical_crossentropy',
16
- metrics=['accuracy'])
17
- model.fit(train_x,train_y, epochs=10, batch_size=bsize)
18
- ```
19
- ③[Factorization Machines(libFM)](https://github.com/oreilly-japan/ml-at-work/blob/master/chap07/Movie_recommendation.ipynb)
20
-
21
- のモデルをStage 0のモデルに挿入したいのですが、下記のようにモデルの本体を入れる入れ方でいいのでしょうか?
22
- 特にkerasのNNの入れ方があってるかわかりません。ご教授お願いします
23
-
24
- ---
25
- **入れるモデルの形式**
26
- ①xgboost→ best_paramsを入れたxgb.train()
27
- xgb.train(best_params, train_xd, num_boost_round=100)
28
-
29
- ②kerasのNN=> model.compile以降のmodel
30
-
31
- ③libFM => mcmc.FMRegression(n_iter=n_iter, rank=rank, random_state=seed)
32
-
33
- ```python
34
- # Stage 0のモデルたち
35
- clfs = [xgb.train(best_params, train_xd, num_boost_round=100),
36
- model, mcmc.FMRegression(n_iter=n_iter, rank=rank, random_state=seed)
37
- ]
38
- ```