質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Q&A

0回答

601閲覧

学習用の色のデータの正規化

argus

総合スコア8

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

0グッド

0クリップ

投稿2021/12/10 11:05

入力値が
[[0.3,"blue"]
[0.5,"red"]
[0.1,yellow"]
[0.7,"green"]]
のような場合の正規化は
[[0.3,0.0]
[0.5,0.33]
[0.1,0.67]
[0.7,1.0]]
で合ってますか?

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

tiitoi

2021/12/10 11:17

2列目の値はどこからきたのでしょうか?
argus

2021/12/10 11:21

正規化は0以上1以下の数値に置き換えるものだと認識しています。 よって数値的な特徴のない色の要素を4分割した数値(0.333ごと)で置き換えています。
tiitoi

2021/12/10 11:24

色っていうと数値データをイメージしますが、色を表す単語を数値にしたいということでしょうか?
argus

2021/12/10 11:37

そうです
tiitoi

2021/12/10 11:41 編集

色の種類が予めいくつか決まっているのであれば、one-hot 表現で数値化するのが一般的ではないでしょうか https://www.codexa.net/get_dummies/ ちなみに「数値データでないものを数値化すること」と「正規化」は別の話です。質問者さんがやらなければならないことは正規化ではなく、前者です。
argus

2021/12/10 11:52

[[0.3,[1,0,0,0]] [0.5,[0,1,0,0]] [0.1,[0,0,1,0]] [0.7,[0,0,0,1]]] ということですか?numpyのndarrayになりません。
tiitoi

2021/12/10 11:54

コード全体がどうなっているのか不明ですが、 [[0.3,1,0,0,0], [0.5,0,1,0,0], [0.1,0,0,1,0], [0.7,0,0,0,1]] となるようにコードを書けばいいと思います
argus

2021/12/10 11:55

初心者質問に丁寧に回答いただきありがとうございました。
jbpb0

2021/12/10 12:32

質問者さん blue→0.0 red→0.33 green→1.0 のような数値化をすると、 ・「red」は「green」よりも「blue」に近い ・「red」は「blue」と「green」の間である みたいな意味が(質問者さんにそういう意図が無くても)生じてしまいます tiitoiさんが紹介した「one-hot表現」なら、そのようなことは生じませんので、順番とか距離とかの意味が勝手に生じてしまうとまずい場合は、そうします
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問