質問を連投してすみません。
時系列のデータで少しデータの持ち方について分からなくなってしまいました。
今、説明変数は
〇顧客ID、年月、複数の営業施策
目的変数は
〇各顧客の認知ステージ6カテゴリー
ただし、年月で峻別しているので、都合12の年月に応じた目的変数があります。
ここで、年月のデータの持ち方なのですが、カラム方法に持つと、目的変数は、12月分あるので、12つの目的変数を持ちます。
一方で、年月を縦持ちした場合、顧客の認知ステージの目的変数は1つになります。
■年月を横持にした時の問題
目的変数が複数になり、完全に把握できていませんが、TensorFlowなどを用いた深層学習ができないようにも思います。
■年月を縦持ちにした時の問題
目的変数は1つになるのですが、顧客IDが複数回現れるために、顧客IDを説明変数化(?)する必要があります。
(正直、必要があるのかどうかもあまり分かりません。)
しかし、顧客IDはなんの意味もない数字のため変数に入れるべきではないような気がします。
より適切なデータの持ち方としては、どちらがすすめられるのでしょうか。
目的によると言われてしまうかもしれませんが、あくまで、顧客の認知ステージを予測することにあります。
若干説明が分かりにくかったらすみません。
宜しくお願い申し上げます。
あなたの回答
tips
プレビュー