質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

1回答

10472閲覧

DataFrameでData must be 1-dimensionalのエラーが出る

NNNMMM

総合スコア0

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2021/05/29 08:39

編集2021/05/29 09:26

前提・実現したいこと

ここに質問の内容を詳しく書いてください。
Pythonで株価予測と共に日付を予測するコードを作成しております。
下記エラーが出て、解決ができません。
読み込んだcsvのyear列をindexにして、データ日付列、終値列をそれぞれトレーニングデータとテストデータにしたいと考えております。冒頭のコードのみでエラーがでましたので、後段のコードは省略致します。

発生している問題・エラーメッセージ

ValueError: Data must be 1-dimensional

該当のソースコード

Python

1from sklearn.model_selection import train_test_split 2import pandas as pd 3 4table = pd.read_csv("table.csv",index_col='year') 5 6X = table.values[:, 0] 7X = pd.DataFrame(map(lambda x: x.replace(",",""),X)).astype('float').values 8y = table.values[:, 1] 9 10X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0, shuffle=False) 11X_train_std = (X_train - X_train.mean()) / X_train.std() 12X_test_std = (X_test - X_train.mean()) / X_train.std() 13 14# df_trainというテーブルを作りそこにindexをyear、カラム名をデータ日付、終値にしてdf_train.csvという名前でdataフォルダ内に出力する。 15df_train = pd.DataFrame( 16 {'データ日付': X_train_std, 17 '終値': y_train}, 18 columns=['データ日付', '終値'], 19 index=table.index[:len(X_train_std)]) 20df_train.to_csv('./df_train.csv')

試したこと

Xは日付データを引用しているため、他の数値データなどに変更して試しましたが、同じエラーが出ました。

補足情報(FW/ツールのバージョンなど)

特になし

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

train_test_splitで得られるX_trainは2次元のndarryです。
従って、X_train_stdも2次元のndarryです。

辞書を指定してpd.DataFrameを呼び出したときには、辞書の各値はリストとか、1次元のndarrayでなくてはならないので、エラーとなります。

何をしたいのかが不明ですので、修正方法まではわかりません。

投稿2021/05/29 08:52

ppaul

総合スコア24666

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問