質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
87.20%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

解決済

pandasを使ったデータフレームの数行まとめてのシャッフル

simpkins
simpkins

総合スコア0

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

1回答

1評価

1クリップ

868閲覧

投稿2020/11/13 13:46

編集2022/01/12 10:58

前提・実現したいこと

時間粒度が1時間のデータが3ヶ月分あります(時間の列はインデックス)。

時間data1data2
2015-04-01 00:00:00110
2015-04-01 01:00:00220
2015-04-01 02:00:00330
:::
2015-04-01 23:00:00440
2015-04-02 00:00:00550
:::
2015-06-30 22:00:00660
2015-06-30 23:00:00770

このデータフレームで、各月ごとに同じ日のデータを一つの塊としてシャッフルしたい。
同じ日のデータを一つの塊にするというのは、例えば、4月1日内の1時と5時のデータをシャッフルなどはせず、0時から23時までを1つの塊とし、4月1日の塊と4月5日の塊や4月2日の塊と4月10日の塊をシャッフルしたりするということ。
4月のデータは4月内だけで、5月のデータは5月内だけでシャッフルする。

最終的にはシャッフルしたデータを1つのリストに格納したい。

該当のソースコード

import pandas as pd import itertools import numpy as np csv = pd.read_csv('sample.csv', parse_dates=[0], index_col=0) data1_m4=[ list(csv.loc['2015-04-01 00:00:00':'2015-04-01 23:00:00', 'data1']),list(csv.loc['2015-04-02 00:00:00':'2015-04-02 23:00:00', 'data1']),list(csv.loc['2015-04-02 00:00:00':'2015-04-02 23:00:00', 'data1']),list(csv.loc['2015-04-03 00:00:00':'2015-04-03 23:00:00', 'data1']),list(csv.loc['2015-04-04 00:00:00':'2015-04-04 23:00:00', 'data1']),list(csv.loc['2015-04-05 00:00:00':'2015-04-02 23:00:00', 'data1']),list(csv.loc['2015-04-06 00:00:00':'2015-04-06 23:00:00', 'data1']) ] np.random.shuffle(data1_m4) a = list(itertools.chain.from_iterable(data1_m4)) #ここで二次元リストを一次元リストにする

試したこと

ここでは4月の中の6日分しか記述していないですが、本来は30日分書きます。
これを他の月でもやり、最後に3ヶ月のリストを1つのリストに結合すれば一応はやりたいことが達成できます。
しかし、このやり方はかなり面倒なので何か簡単にできる方法はないでしょうか。

補足情報(FW/ツールのバージョンなど)

ここにより詳細な情報を記載してください。

良い質問の評価を上げる

以下のような質問は評価を上げましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

  • プログラミングに関係のない質問
  • やってほしいことだけを記載した丸投げの質問
  • 問題・課題が含まれていない質問
  • 意図的に内容が抹消された質問
  • 過去に投稿した質問と同じ内容の質問
  • 広告と受け取られるような投稿

評価を下げると、トップページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

まだ回答がついていません

会員登録して回答してみよう

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
87.20%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。