前提・実現したいこと
**機械学習初心者です。**Python3を使って、ID別に日毎のタスクを持つ、ばらつきのあるデータをインポートし、クラスタリングの中心となるような(頻度の高い?)タスクの中身を取得したいです。お知恵をお借りできましたら幸いです。 ※初めての質問で至らない点ばかりだと思いますが、ご容赦ください。
発生している問題・エラーメッセージ
どのような手法を用いれば良いか全くイメージがつかず、類似する情報も見つかられず困っています。
試したこと
SQLで項目を行、日付(何日目)を列、タスクのクロス集計はしました。しかし、クロス集計後のデータをPythonにインポートしてクラスタリングを行えばよいのか、クロス集計前の横持ちデータをPythonにインポートしてクラスタリング等を行えば良いのかすらわからず、そもそもクラスタリングをすることで望んでいることができるのかすらわからず、途方に暮れています。何卒よろしくお願いいたします。
。
あなたの回答
tips
プレビュー