質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
Jupyter

Jupyter (旧IPython notebook)は、Notebook形式でドキュメント作成し、プログラムの記述・実行、その実行結果を記録するツールです。メモの作成や保存、共有、確認などもブラウザ上で行うことができます。

Q&A

0回答

550閲覧

テストデータの分割について

pmaki

総合スコア3

Jupyter

Jupyter (旧IPython notebook)は、Notebook形式でドキュメント作成し、プログラムの記述・実行、その実行結果を記録するツールです。メモの作成や保存、共有、確認などもブラウザ上で行うことができます。

0グッド

0クリップ

投稿2021/01/18 07:49

前提・実現したいこと

test train splitを使ってテストデータを分割
前提となるX,Yのデータセットの作成

発生している問題・エラーメッセージ

前提となるX,Yのデータセットの作成
(今回ベースとなるデータは顧客データ(エクセル)でして
データによって異なると思いますが、一般的なコードを教えて頂ければ幸いです)

該当のソースコード

jupyter

試したこと

下記のように別コードを参考に入力したが、上手く出力されない

~reading the file into Python
chef = pd.read_csv(file)

X = chef[target_column]
y = chef[feature_num_columns]

~Create training and test sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.25, random_state=219)

ここに問題に対して試したことを記載してください。

補足情報(FW/ツールのバージョンなど)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2021/01/18 12:19

> 下記のように別コードを参考に入力したが、上手く出力されない 「上手く出力されない」とはどういうことでしょうか?
pmaki

2021/01/18 12:26

下記のエラーメッセージが出てしまう状況です。よろしくお願い致します。 --------------------------------------------------------------------------- KeyError Traceback (most recent call last) ~\anaconda3\lib\site-packages\pandas\core\indexes\base.py in get_loc(self, key, method, tolerance) 2890 try: -> 2891 return self._engine.get_loc(casted_key) 2892 except KeyError as err: pandas\_libs\index.pyx in pandas._libs.index.IndexEngine.get_loc() pandas\_libs\index.pyx in pandas._libs.index.IndexEngine.get_loc() pandas\_libs\hashtable_class_helper.pxi in pandas._libs.hashtable.PyObjectHashTable.get_item() pandas\_libs\hashtable_class_helper.pxi in pandas._libs.hashtable.PyObjectHashTable.get_item() KeyError: 'X' The above exception was the direct cause of the following exception: KeyError Traceback (most recent call last) <ipython-input-43-128784b57006> in <module> ----> 1 X = chef[target_column] 2 y = chef[feature_num_columns] 3 4 # preparing training and testing sets (all letters are lowercase) 5 X_train, X_test, y_train, y_test = train_test_split( ~\anaconda3\lib\site-packages\pandas\core\frame.py in __getitem__(self, key) 2900 if self.columns.nlevels > 1: 2901 return self._getitem_multilevel(key) -> 2902 indexer = self.columns.get_loc(key) 2903 if is_integer(indexer): 2904 indexer = [indexer] ~\anaconda3\lib\site-packages\pandas\core\indexes\base.py in get_loc(self, key, method, tolerance) 2891 return self._engine.get_loc(casted_key) 2892 except KeyError as err: -> 2893 raise KeyError(key) from err 2894 2895 if tolerance is not None: KeyError: 'X'
meg_

2021/01/18 12:39

他の回答者にも伝わるように情報は質問に追記しましょう。
meg_

2021/01/18 12:42

エラー発生箇所は「X = chef[target_column]」でしょうか? データフレーム chefにtarget_columnという列は存在していますか?
pmaki

2021/01/19 02:46 編集

meg_さま ご確認ありがとうございます。エラー発生箇所は、ご指摘の通り「X = chef[target_column]」で、データフレーム chefにtarget_columnという列は設定していませんでした。 X,yについては特定のカラムを指定するのが一般的でしょうか? 改めて見直してみたいと思います。
meg_

2021/01/20 00:12

推測するに機械学習用のデータを指しているかと思いますが、何を特徴量とするかはそれぞれですし、そのデータの生成方法もそれぞれだと思います。
pmaki

2021/01/21 07:52

ありがとうございます!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問