質問編集履歴

誤字訂正

2018/11/13 03:49

投稿

dal

スコア38

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -66,7 +66,7 @@
 #出力結果=>[2]
 ```
-今度は１つ前の出力結果と等しくなります。一体どういう仕組みでラベルの数値かが行われているのか、とても気になっています。
+今度は１つ前の出力結果と等しくなります。一体どういう仕組みでラベルの数値化が行われているのか、とても気になっています。
 ####質問
 LabelEncoderを用いた際、ラベル名を数値に変換する際にどういったルールがあるのか、詳しい方がいたら教えていただきたいです。

317 514 772

タイトル改善

2018/11/13 03:49

投稿

dal

スコア38

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,6 +1,6 @@
 scikit-learnのLabelEncoderに関する質問です。
-#####実行内容・疑問点
+####実行内容・疑問点
 まず以下のようにしてLabelEncodingを行いました。（ jupiter notebookを用いています。）
@@ -68,5 +68,5 @@
 今度は１つ前の出力結果と等しくなります。一体どういう仕組みでラベルの数値かが行われているのか、とても気になっています。
-#####質問
+####質問
 LabelEncoderを用いた際、ラベル名を数値に変換する際にどういったルールがあるのか、詳しい方がいたら教えていただきたいです。

317 514 772

内容の改善

2018/11/12 13:51

投稿

dal

スコア38

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,8 +1,8 @@
 scikit-learnのLabelEncoderに関する質問です。
-#####疑問点
+#####実行内容・疑問点
-まず以下のようにしてLabelEncodingを行いました。
+まず以下のようにしてLabelEncodingを行いました。（ jupiter notebookを用いています。）
 ``` python
 from sklearn.preprocessing import LabelEncoder
@@ -14,7 +14,7 @@
 le = LabelEncoder()
 le.fit(["umi", "yama", "tokyo", "kyoto"])
-le.transform(["yama"])
+print(le.transform(["yama"]))
 #出力結果=>[3]
 ```
@@ -25,7 +25,7 @@
 le.fit(["umi", "yama", "tokyo", "kyoto"])
 ```
-をとして、LabelEncoder()を定義し直し、再びfit()を行なっている訳ですが、transform(["yama"])の出力結果が１度目と等しくなります。
+として、LabelEncoder()を定義し直し、再びfit()を行なっている訳ですが、le.transform(["yama"])の出力結果が１度目と等しくなります。
 次に、
@@ -41,9 +41,9 @@
 #出力結果=>[1]
 ```
-を行いましたが、やはりtransform(["tokyo"])の出力結果が等しくなりました。
+を行いましたが、やはりle.transform(["tokyo"])の出力結果が等しくなりました。
-ここで、変換したいデータ名が等しければ、LabelEncoder()を定義し直し、再度fit()を行なっても、出力結果が必ず等しくなるのかな？と思ったのです。
+ここで、ラベル名が等しければ、LabelEncoder()を定義し直し、再度fit()を行なっても、出力結果が必ず等しくなるのかな？と思ったのです。
 しかし、以下のコードを実行したところ、
@@ -51,5 +51,22 @@
 le = LabelEncoder()
 le.fit(["umi", "yama", "tokyo", "kyoto","mori"])
 print(le.transform(["tokyo"]))
-#出力結果=>[]
+#出力結果=>[2]
-```
+```
+le.transform(["tokyo"])の出力が、[1]ではなく[2]になりました。
+変更点は、fit()に用いるラベルを１つ追加したことです。
+さらに、以下も実行しました。
+```python
+le = LabelEncoder()
+le.fit(["umi", "yama", "tokyo", "kyoto","mori","mori","mori","mori"])
+print(le.transform(["tokyo"]))
+#出力結果=>[2]
+```
+今度は１つ前の出力結果と等しくなります。一体どういう仕組みでラベルの数値かが行われているのか、とても気になっています。
+#####質問
+LabelEncoderを用いた際、ラベル名を数値に変換する際にどういったルールがあるのか、詳しい方がいたら教えていただきたいです。

317 514 772