機械学習で分類問題を実装したいと考えております。
例)
data1 各人の身長の分類 3分類
data2 各人が男性か女性か 2分類
data3 各人の年齢 10分類
・
・
・
data10 各人の体重 10分類
のような10個の学習済みデータを組み合わせて人の識別
このような分類問題を実装するにはランダムフォレストを実装して行うのが適切なのでしょうか?
機械学習初心者のため知識がある方、ご教授いただけるとありがたいです。
> 人の識別
というのは,個人を識別するという話ですか?
「身長は低くて,女性で,21歳で,……,体重は175kg なんだけど,さて,これは誰でしょう?」的な?
fanaさん
コメントありがとうございます。
はい。そのような感じで識別したいと思っております。
「分類問題」を勘違いされていますね。
分類問題とは、質問者様が示したような、説明変数が分類されている(カテゴリー値になっている)こと、ではありません。説明変数がカテゴリ値かどうかは関係ありません。推測すべき目的変数が分類されていることです。例えば、質問者様が示した属性を説明変数として持つ人が、タイタニック号が沈没したときに生還したかどうか(0 or 1)を推測する問題であれば、分類問題になります。また、誰でしょうか?という問題であっても、候補が10人くらいなのであれば、分類問題になりえます。