質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
DateTime

多くのプログラミング言語におけるDateTimeオブジェクトは、日付と時間に関する演算と出力を行います。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

1回答

2407閲覧

Pythonで予測(RandomForestRegressor)を使うと負のscoreになるのがどういう意味ですか?

samankoar

総合スコア7

DateTime

多くのプログラミング言語におけるDateTimeオブジェクトは、日付と時間に関する演算と出力を行います。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/06/01 05:44

編集2020/06/02 05:34

元のデータです
イメージ説明
地震のデータセットを用いて、発生時期・緯度・経度からマグニチュードと深さを予測しようと思っていますが、発生日付のフォーマットでうまくいきません

print(data.dtypes) time datetime64[ns, UTC] latitude float64 longitude float64 depth float64 mag float64 magType object nst float64 gap float64 dmin float64 rms float64 net object id object updated object place object type object horizontalError float64 depthError float64 magError float64 magNst float64 status object locationSource object magSource object dtype: object

コードは

#timeを日付と時間に分割 data['new_date'] = [d.date() for d in data['time']] data['new_time'] = [d.time() for d in data['time']] final_data = data[['time', 'new_date', 'new_time', 'latitude', 'longitude', 'depth', 'mag']]

確認すると

time datetime64[ns, UTC] new_date object new_time object latitude float64 longitude float64 depth float64 mag float64 dtype: object
final_data['month']= final_data['time'].dt.month final_data['year']= final_data['time'].dt.year #データをtrainとtest用に分けます X = final_data[['year', 'month', 'latitude', 'longitude']] y = final_data[['mag', 'depth']] from sklearn.model_selection import train_test_split X_train, X_test,y_train, y_test = train_test_split(X, y, test_size=0.20, random_state=42) print(X_train.shape, X_test.shape, y_train.shape, y_test.shape)

(107, 4) (27, 4) (107, 2) (27, 2)

#予測をするためにrandomforestを実行する from sklearn.ensemble import RandomForestRegressor reg = RandomForestRegressor(random_state=42) reg.fit((X_train), (y_train)) reg.predict(X_test)

array([[ 4.65 , 20.75 ],
[ 4.61 , 10.223],
[ 4.68 , 10. ],
[ 4.72 , 10. ],
[ 4.9 , 11.02 ],
[ 4.57 , 9.983],
[ 4.59 , 16.735],
[ 4.69 , 9.543],
[ 5.37 , 17.217],
[ 5.02 , 18.4 ],
[ 5.1 , 11.2 ],
[ 4.66 , 10. ],
[ 4.72 , 26.106],
[ 5.77 , 11.3 ],
[ 4.66 , 10.159],
[ 5.09 , 29.443],
[ 4.55 , 9.983],
[ 4.84 , 16.776],
[ 4.55 , 9.983],
[ 4.71 , 10. ],
[ 5.2 , 13.439],
[ 4.72 , 9.847],
[ 4.77 , 12.127],
[ 4.63 , 22.94 ],
[ 4.72 , 10.767],
[ 5.49 , 11.3 ],
[ 5.04 , 10.2 ]])

reg.score(X_test, y_test)

-7.319324727219347

答えはマイナスになるのです。
new_dateとnew_timeの代わりにtimeを使ってもエラーになります(以下の)。

TypeError: float() argument must be a string or a number, not 'Timestamp'

予測に影響が大きのは月と年です。どうパラメータを正しく取ればいいのかわからないです
何が違うかヒントをいただけませんか
よろしくお願いします

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

reg.fit(str(X_train), str(y_train))
stringにしてませんか...?

投稿2020/06/01 06:17

jeanbiego

総合スコア3966

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

samankoar

2020/06/01 06:30 編集

そうでした。思い出しました。最初は reg.fit(X_train, y_train) でやってました。しかしこのエラーが出ました TypeError: float() argument must be a string or a number, not 'Timestamp' なので、 final_data['time']=final_data['time'].astype(str) final_data['latitude']=final_data['latitude'].astype(str) final_data['longitude']=final_data['longitude'].astype(str) final_data['mag']=final_data['mag'].astype(str) final_data['depth']=final_data['depth'].astype(str) のように変更しましたが、以下のエラーが出ました ValueError: could not convert string to float: '2016-06-29 22:56:14.420000+00:00'
jeanbiego

2020/06/01 06:37

この辺の過去質問とかが参考になりますか https://teratail.com/questions/164605 あるいは、どのようにtimestampを扱うかという別の質問を立てたほうが良いかと思います。
samankoar

2020/06/01 08:44

@jeanbiegoありがとうございました。質問(内容!)を変えてみました
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問