質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

1回答

2901閲覧

列ラベルを新しく設定する方法

raurau4471

総合スコア13

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2020/04/14 10:05

編集2020/04/14 11:47

列ラベルを新しく設定する方法について

DataFrameに対して、新しく列ラベルを設定(追加)する方法を模索しています。
以下に示したコードの出力のようなデータに対して、1列目に"Time"、2列目に"Precipitation"という列ラベルをつけることを目的としています。

該当のソースコード

縦軸に日付、横軸に時刻が示されていたデータを、時系列順に縦1列に並び変える作業を行っています。出力を見て頂ければわかるとおり、現在はラベルが存在しない(?)状態です。

python

1import pandas as pd 2 3df = pd.read_csv("train_data.csv", index_col='Date') 4df.columns = [f'{i:02d}:00' for i in range(24)] 5df = df.stack() 6df.index = pd.to_datetime(df.index.get_level_values(0) + ' ' + df.index.get_level_values(1)) 7df.head(25) 8 92019-01-01 00:00:00 0 102019-01-01 01:00:00 0 112019-01-01 02:00:00 0 122019-01-01 03:00:00 0 132019-01-01 04:00:00 0 142019-01-01 05:00:00 0 152019-01-01 06:00:00 0 162019-01-01 07:00:00 0 172019-01-01 08:00:00 0 182019-01-01 09:00:00 0 192019-01-01 10:00:00 0 202019-01-01 11:00:00 0 212019-01-01 12:00:00 0 222019-01-01 13:00:00 0 232019-01-01 14:00:00 0 242019-01-01 15:00:00 0 252019-01-01 16:00:00 0 262019-01-01 17:00:00 0 272019-01-01 18:00:00 0 282019-01-01 19:00:00 0 292019-01-01 20:00:00 0 302019-01-01 21:00:00 0 312019-01-01 22:00:00 0 322019-01-01 23:00:00 1 332019-01-02 00:00:00 1

補足情報

時系列データの前処理を勉強中で、Google Colabを利用しています。
元のcsvファイルは次のような状態です。
イメージ説明

次のような状態を目指しています。
イメージ説明

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2020/04/14 11:09

元のcsvのデータと欲しい結果を提示された方が回答しやすいかと思います。
raurau4471

2020/04/14 11:39

ご指摘ありがとうございます。追加させていただきました。
guest

回答1

0

ベストアンサー

stack()の結果、dfはSeriesになっています。

stack()メソッドはマルチインデックス(階層型インデックス)のpandas.Seriesを返す。

pandasでstack, unstack, pivotを使ってデータを整形

DataFrameに戻しましょう。

Python

1import pandas as pd 2 3df = pd.read_csv('test.csv', index_col='Date') 4df.columns = [f'{i:02d}:00' for i in range(24)] 5df = df.stack() 6df.index = pd.to_datetime(df.index.get_level_values(0) + ' ' + df.index.get_level_values(1)) 7 8df2 = pd.DataFrame(df) 9df2.reset_index(inplace=True) 10df2.columns = ['Time', 'Precipitation'] 11print(df2) 12 Time Precipitation 130 2019-01-01 00:00:00 0 141 2019-01-01 01:00:00 0 152 2019-01-01 02:00:00 0 163 2019-01-01 03:00:00 0 174 2019-01-01 04:00:00 0 185 2019-01-01 05:00:00 0 196 2019-01-01 06:00:00 0 207 2019-01-01 07:00:00 0 218 2019-01-01 08:00:00 0 229 2019-01-01 09:00:00 0 2310 2019-01-01 10:00:00 0 2411 2019-01-01 11:00:00 0 2512 2019-01-01 12:00:00 0 2613 2019-01-01 13:00:00 0 2714 2019-01-01 14:00:00 0 2815 2019-01-01 15:00:00 0 2916 2019-01-01 16:00:00 0 3017 2019-01-01 17:00:00 0 3118 2019-01-01 18:00:00 0 3219 2019-01-01 19:00:00 0 3320 2019-01-01 20:00:00 0 3421 2019-01-01 21:00:00 0 3522 2019-01-01 22:00:00 0 3623 2019-01-01 23:00:00 0 3724 2019-01-02 00:00:00 0 3825 2019-01-02 01:00:00 0 3926 2019-01-02 02:00:00 0 4027 2019-01-02 03:00:00 0 4128 2019-01-02 04:00:00 0 4229 2019-01-02 05:00:00 0 43.. ... ...

投稿2020/04/14 14:01

meg_

総合スコア10605

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

raurau4471

2020/04/14 14:17

ご回答ありがとうございます。無事解決しました。 DataFrameとSeriesの違い、基礎的な理解が不足していると痛感しました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問