質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

88.58%

Start_timeとEnd_timeの抜きだす方法(画像(1)のデータフレームを基に、画像(2)のcsvを作る方法)

解決済

回答 1

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 471

shin_shin

score 92

最初に質問を完結に表現します。
[質問]
以下の(1)のデータフレームを基に、(2)のcsvを完成させたいです。
そのpythonコードをfor文を使わずに表現したいです。

(1)
イメージ説明

(2)
イメージ説明

[補足説明]

  1. (2)の"Start_Time"と"End_Time"というのは、(1)の"Status_GTCC_Efficiency"の各valueがどのくらい連続しているかを示すものです。

  2. つまり、以下を例にすると、"2016/1/1 0:00"から"2016/1/1 0:04"まで、Status "M"が連続していた。ということになります。
    Start_Time      End_Time      Duration      Status
    2016/1/1 0:00    2016/1/1 0:04    5          M

それをpythonでどのようにコーディングできるか、ご教示願います。
よろしくお願いいたします。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • y_waiwai

    2018/10/31 15:47

    タイトルのdfというのは関係ないのでしょうか?

    キャンセル

  • shin_shin

    2018/10/31 15:50

    関係ある、という認識です。dataframeを作って、to_csv()するという流れを自分の中で想定してました。確かに、タイトル誤解を与えてしまうと思うので、書き換えます。

    キャンセル

  • y_waiwai

    2018/10/31 15:51

    ああ、dfってデータフレームの略でしたかw

    キャンセル

回答 1

checkベストアンサー

+1

こんな感じで出来るかと思います

import pandas as pd

# データ作成
N = 20
df = pd.DataFrame(
    {
        'Time': pd.date_range('2016/01/01 00:00', periods=N, freq='1Min'),
        'Status_GTCC_Efficiency' : ['M','M','M','M','M','H','H','H','H','H','M','M','M','M','M','H','H','H','H','H']
    }
)
df = df.set_index('Time')

# データGroupIDをふる
df['GroupID']= (df['Status_GTCC_Efficiency'].shift() != df['Status_GTCC_Efficiency']).cumsum()

# 出力データ生成用関数
def func(d):
    return pd.Series({
        'Start_Time':d.index[0],
        'End_Time':d.index[-1],
        'Duration': len(d),
        'Status': d['Status_GTCC_Efficiency'][0]
    })


# GroupID によりグループ毎に上記の関数を適用する
res = df.groupby('GroupID').apply(func).reset_index(drop=True)
# 一応列順を整理
res = res.loc[:,['Start_Time', 'End_Time', 'Duration', 'Status']]
print(res)
#           Start_Time            End_Time  Duration Status
#0 2016-01-01 00:00:00 2016-01-01 00:04:00         5      M
#1 2016-01-01 00:05:00 2016-01-01 00:09:00         5      H
#2 2016-01-01 00:10:00 2016-01-01 00:14:00         5      M
#3 2016-01-01 00:15:00 2016-01-01 00:19:00         5      H

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 88.58%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る