質問編集履歴
3
コードの編集
test
CHANGED
File without changes
|
test
CHANGED
@@ -134,7 +134,7 @@
|
|
134
134
|
|
135
135
|
# ここからが本当にやりたいことで、問題が生じているところ
|
136
136
|
|
137
|
-
# モデルを構築した後に新たなデータをダミーに変換して特徴量を得たい
|
137
|
+
# モデルを構築した後に新たなデータのみを意味合いを保ったままダミーに変換して特徴量を得たい
|
138
138
|
|
139
139
|
prediction=logreg.predict([39,'State-gov','Bachelors','Male',40,'Adm-clerical'])
|
140
140
|
|
2
コードの編集
test
CHANGED
File without changes
|
test
CHANGED
@@ -144,7 +144,19 @@
|
|
144
144
|
|
145
145
|
'''
|
146
146
|
|
147
|
-
例えば、[39,'State-gov','Bachelors','Male',40,'Adm-clerical']のSampleデータのみ
|
147
|
+
例えば、[39,'State-gov','Bachelors','Male',40,'Adm-clerical']のSampleデータのみ
|
148
|
+
|
149
|
+
をモデルに与えて予測をしたのちに上記のように「Some prediction: <=50K」を結果を表示したい。
|
150
|
+
|
151
|
+
このときにpredict関数に渡すためにまずSampleデータを特徴量のデータに変換する必要が
|
152
|
+
|
153
|
+
あり、ダミー変数を使うだろうが、Sampleデータ単体だけで変換したものと、すでに変換した
|
154
|
+
|
155
|
+
data_dummiesでは意味がことなってくるので、このSampleデータのみでは
|
156
|
+
|
157
|
+
get_dummies関数で正しく変換できないと思われる。すでにダミー変数の手本(今回はすでに変換したdata_dummies)
|
158
|
+
|
159
|
+
みたいなものがあるのでこれを用いてSampleデータを変換したいがやり方がわからない。
|
148
160
|
|
149
161
|
'''
|
150
162
|
|
@@ -152,6 +164,8 @@
|
|
152
164
|
|
153
165
|
```
|
154
166
|
|
155
|
-
現在、O'REILLYの「Pythonで始める機械学習」でモデルの勉強をしています。ここでは与えられたデータからそれに対応する人の収入が50000$以上かを2クラス分類で予測するモデルを構築しました。
|
167
|
+
現在、O'REILLYの「Pythonで始める機械学習」でモデルの勉強をしています。ここでは与えられたデータからそれに対応する人の収入が50000$以上かを2クラス分類で予測するモデルを構築しました。
|
168
|
+
|
169
|
+
ですが、実際に使うとき、ある人、一人のデータがあり、それをモデルに渡し、その人の予想結果だけを知りたいとなったときに、その渡す少ないデータを、構築済みのモデルに適した形の特徴量に変換する方法がわかりません。ネットなどでできる限り調べたのですが、scoreでR^2値を出して終わっているモデル例ばかりで参考になるものを見つけきれませんでした。
|
156
170
|
|
157
171
|
助言をお願いします。
|
1
コードの編集
test
CHANGED
File without changes
|
test
CHANGED
@@ -134,6 +134,8 @@
|
|
134
134
|
|
135
135
|
# ここからが本当にやりたいことで、問題が生じているところ
|
136
136
|
|
137
|
+
# モデルを構築した後に新たなデータをダミーに変換して特徴量を得たい
|
138
|
+
|
137
139
|
prediction=logreg.predict([39,'State-gov','Bachelors','Male',40,'Adm-clerical'])
|
138
140
|
|
139
141
|
# 特徴量に変換していないのでErrorを吐いてしまう。
|