質問編集履歴

3

コードの編集

2021/11/05 02:38

投稿

hima-mura.
hima-mura.

スコア42

test CHANGED
File without changes
test CHANGED
@@ -134,7 +134,7 @@
134
134
 
135
135
  # ここからが本当にやりたいことで、問題が生じているところ
136
136
 
137
- # モデルを構築した後に新たなデータをダミーに変換して特徴量を得たい
137
+ # モデルを構築した後に新たなデータのみ意味合いを保ったままダミーに変換して特徴量を得たい
138
138
 
139
139
  prediction=logreg.predict([39,'State-gov','Bachelors','Male',40,'Adm-clerical'])
140
140
 

2

コードの編集

2021/11/05 02:38

投稿

hima-mura.
hima-mura.

スコア42

test CHANGED
File without changes
test CHANGED
@@ -144,7 +144,19 @@
144
144
 
145
145
  '''
146
146
 
147
- 例えば、[39,'State-gov','Bachelors','Male',40,'Adm-clerical']のSampleデータのみをモデルに与えて予測をしたのちに上記のように「Some prediction: <=50K」を結果を表示したい。このときにpredict関数に渡すためにまずSampleデータを特徴量のデータに変換する必要があり、ダミー変数を使うだろうが、Sampleデータ単体だけで変換したものと、すでに変換したdata_dummiesでは意味がことなってくるので、このSampleデータのみではget_dummies関数で正しく変換できないと思われる。すでにダミー変数の手本(今回はすでに変換したdata_dummies)みたいなものがあるのでこれを用いてSampleデータを変換したいがやり方がわからない。
147
+ 例えば、[39,'State-gov','Bachelors','Male',40,'Adm-clerical']のSampleデータのみ
148
+
149
+ をモデルに与えて予測をしたのちに上記のように「Some prediction: <=50K」を結果を表示したい。
150
+
151
+ このときにpredict関数に渡すためにまずSampleデータを特徴量のデータに変換する必要が
152
+
153
+ あり、ダミー変数を使うだろうが、Sampleデータ単体だけで変換したものと、すでに変換した
154
+
155
+ data_dummiesでは意味がことなってくるので、このSampleデータのみでは
156
+
157
+ get_dummies関数で正しく変換できないと思われる。すでにダミー変数の手本(今回はすでに変換したdata_dummies)
158
+
159
+ みたいなものがあるのでこれを用いてSampleデータを変換したいがやり方がわからない。
148
160
 
149
161
  '''
150
162
 
@@ -152,6 +164,8 @@
152
164
 
153
165
  ```
154
166
 
155
- 現在、O'REILLYの「Pythonで始める機械学習」でモデルの勉強をしています。ここでは与えられたデータからそれに対応する人の収入が50000$以上かを2クラス分類で予測するモデルを構築しました。ですが、実際に使うとき、ある人、一人のデータがあり、それをモデルに渡し、その人の予想結果だけを知りたいとなったときに、その渡す少ないデータを、構築済みのモデルに適した形の特徴量に変換する方法がわかりません。ネットなどでできる限り調べたのですが、scoreでR^2値を出して終わっているモデル例ばかりで参考になるものを見つけきれませんでした。
167
+ 現在、O'REILLYの「Pythonで始める機械学習」でモデルの勉強をしています。ここでは与えられたデータからそれに対応する人の収入が50000$以上かを2クラス分類で予測するモデルを構築しました。
168
+
169
+ ですが、実際に使うとき、ある人、一人のデータがあり、それをモデルに渡し、その人の予想結果だけを知りたいとなったときに、その渡す少ないデータを、構築済みのモデルに適した形の特徴量に変換する方法がわかりません。ネットなどでできる限り調べたのですが、scoreでR^2値を出して終わっているモデル例ばかりで参考になるものを見つけきれませんでした。
156
170
 
157
171
  助言をお願いします。

1

コードの編集

2021/11/04 13:55

投稿

hima-mura.
hima-mura.

スコア42

test CHANGED
File without changes
test CHANGED
@@ -134,6 +134,8 @@
134
134
 
135
135
  # ここからが本当にやりたいことで、問題が生じているところ
136
136
 
137
+ # モデルを構築した後に新たなデータをダミーに変換して特徴量を得たい
138
+
137
139
  prediction=logreg.predict([39,'State-gov','Bachelors','Male',40,'Adm-clerical'])
138
140
 
139
141
  # 特徴量に変換していないのでErrorを吐いてしまう。