質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
scikit-learn

scikit-learnは、Pythonで使用できるオープンソースプロジェクトの機械学習用ライブラリです。多くの機械学習アルゴリズムが実装されていますが、どのアルゴリズムも同じような書き方で利用できます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

0回答

1117閲覧

時系列データのデータの持ち方について

onosan

総合スコア59

scikit-learn

scikit-learnは、Pythonで使用できるオープンソースプロジェクトの機械学習用ライブラリです。多くの機械学習アルゴリズムが実装されていますが、どのアルゴリズムも同じような書き方で利用できます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2021/09/01 08:00

質問を連投してすみません。
時系列のデータで少しデータの持ち方について分からなくなってしまいました。

今、説明変数は
〇顧客ID、年月、複数の営業施策

目的変数は
〇各顧客の認知ステージ6カテゴリー
ただし、年月で峻別しているので、都合12の年月に応じた目的変数があります。

ここで、年月のデータの持ち方なのですが、カラム方法に持つと、目的変数は、12月分あるので、12つの目的変数を持ちます。
一方で、年月を縦持ちした場合、顧客の認知ステージの目的変数は1つになります。

■年月を横持にした時の問題
目的変数が複数になり、完全に把握できていませんが、TensorFlowなどを用いた深層学習ができないようにも思います。

■年月を縦持ちにした時の問題
目的変数は1つになるのですが、顧客IDが複数回現れるために、顧客IDを説明変数化(?)する必要があります。
(正直、必要があるのかどうかもあまり分かりません。)
しかし、顧客IDはなんの意味もない数字のため変数に入れるべきではないような気がします。

より適切なデータの持ち方としては、どちらがすすめられるのでしょうか。
目的によると言われてしまうかもしれませんが、あくまで、顧客の認知ステージを予測することにあります。

若干説明が分かりにくかったらすみません。
宜しくお願い申し上げます。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問