環境:MacOS 10.12.6、Python 3.7.4、Tensorflow 1.13.2
###ECサイトでよく見かけるレコメンド機能を実装したい
ディープラーニングのRNN(LSTM含む)の学習が終わって、さ〜試してみよう、という段階まできたのですが、学習プログラムで使っていたデータはただの数字の羅列か言語モデルでした。
実際に自分でコレっというデータで学習しようにも、ディープラーニング用にどんなデータをどういう風に用意していいかわかりません。
最終的な目標はECサイトの「この商品を購入している人は(その後)こんな商品も購入しています」というレコメンド機能をお試しで作ることです。
元データはこんな感じでしょうか。
足らなければ追加します。
user_id | datetime | p_id | post_num |
---|---|---|---|
100321 | 2019-01-01 19:02:41 | 673482349878 | 110-0003 |
101957 | 2019-03-11 10:21:07 | 687468758448 | 778-0012 |
107277 | 2019-05-30 12:33:91 | 645058389846 | 106-0023 |
・・・ |
例えば学習プログラムでは
python
1(x_train, y_train), (x_test, y_test) = mnist.load_data() 2print(x_train[:1], y_train[:1]) 3 4# result 5[[ 3.6908443e+00 7.1141434e-01 -2.1140914e+00 -4.1410069e+00 6 -4.5744715e+00 -3.4319086e+00 -1.9507914e+00 -1.1070668e+00 7 ・ 8 ・ 9 ・ 10 6.6552722e-01 1.0359968e+00 1.4922866e+00 -1.9050734e+00]] [0]
といった数字なので単純明快です。
ですが欲しい結果が商品番号だったり複数欲しいとなると、この後どうしてよいものやら、ググっても中々わかりやすいパターンが見つかりません。
何かヒントでも頂けないでしょうか?
追記
この記事がやりたい事になんとなく近い感じなのがわかりました。
KerasでLSTMを学習する手順を整理してみた
この例にある1〜14の数字をそのまま文字列にしても問題はないのでしょうか?
回答1件
あなたの回答
tips
プレビュー