機械学習　　大量に存在する文字列のデータ前処理について

機械学習をする上で文字列のデータ前処理は、ダミー変数化するやり方がありますが、
47都道府県の文字列など、文字列の種類が大量に存在する場合も、同様の手法を取るのが良いのでしょうか？

行動規範の内容に同意します

回答1件

ベストアンサー

どういうデータをどういう目的で分析するかがわからないと何とも言えないですが、文字列の種類が多くてもそれが有効であればダミー変数化するのは間違っていないと思います。

投稿2019/11/08 11:11

総合スコア438

2019/11/08 12:47

ご親切にお返事いただきまして誠にありがとうございます。表示が多過ぎて不安になりましたが、とりあえず進めてみたいと思います。

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問