Python pandasを使った列から行の転地方法を教えてください。

Question

Pandasで整形されたDataflameの要素を列から行に転地させる方法を教えてください。
単純に列から行に変換するのではなく、特定時間内の要素を抽出し、その要素を扱って転地させたいです。

[前提条件]

変換前のデータは、type1～3,centerが異なる間隔でVALUEとUnixTimeが行に追加されてます。
 type1 ・・・ 60秒間隔
 type2,type3,center　・・・300秒間隔

その中から、centerのUnixTime時間を中心に直近のtype1,type2,type3のVALUEを抽出し行に変換させたいです。存在しない要素は、Noneとする。
※[変換前データ]から[変換後データ]に変換するイメージです。


[変換前データ]
       TYPE   VALUE       UnixTime
0      type1  1702563840  1515023945
...   ...         ...         ...
2663   type1  1410232320  1515475537
2664   type1  1440903168  1515475597
2665   type2          99  1515475610
2666   center         76  1515475613
2667   type3        8888  1515475616
2668   type1  1420496896  1515475657
2669   type1  1421422592  1515475717
2670   type1  1422209024  1515475777
2671   type1  1421869056  1515475837
2672   type1  1421123584  1515475897
2673   type2          99  1515475910
2674   center         76  1515475913
2675   type3        8888  1515475915
2676   type1  1420967936  1515475957
2677   type1  1425268736  1515476017
2678   type1  1425866752  1515476077
2679   type1  1427623936  1515476137
2680   type1  1426640896  1515476197
2681   type2          99  1515476210
2682   center         76  1515476213
2683   type3        8888  1515476215
2684   type1  1424646144  1515476257
2685   type1  1426501632  1515476317
2686   type1  1428205568  1515476377
2687   type1  1428369408  1515476437
2688   type1  1428361216  1515476497
2689   type2          99  1515476510
2690   center         76  1515476513
2691   type3        8888  1515476515
2692   type1  1426857984  1515476557

[2693 rows x 3 columns]


[変換後データ]
※UnixTimeは、centerの時間
       type1, type2, type3, center, UnixTime
0      VALUE,  VALUE, VALUE, VALUE, UnixTime 
1      VALUE,  VALUE, VALUE, VALUE, UnixTime 
...    ...     ...     ...   ...    ...

Accepted Answer

結構面倒かも・・
とりあえずの方法としては

1. ``unixtime``をIndexに設定
2. dataframeから ``center``を抜き出す
3. dataframeから ``type1``を抜き出し、2のデータのIndexでreindex(method='nearest')する
4. 2のデータと3のデータを結合する
5. type2,type3で上記3～4を繰り返す
6. ``unixtime``をIndexから外す

で良いかと思います。

一応サンプルコードです。

```Python
import pandas as pd
import io

# ダミーデータ
data="""type,value,unixtime
type1,1410232320,1515475537
type1,1440903168,1515475597
type2, 97,1515475610
center,76,1515475613
type3,8887,1515475616
type1,1420496896,1515475657
type1,1421422592,1515475717
type1,1422209024,1515475777
type1,1421869056,1515475837
type1,1421123584,1515475897
type2, 98,1515475910
center,77,1515475913
type3,8888,1515475915
type1,1420967936,1515475957
type1,1425268736,1515476017
type1,1425866752,1515476077
type1,1427623936,1515476137
type1,1426640896,1515476197
type2, 99,1515476210
center,78,1515476213
type3,8889,1515476215
type1,1424646144,1515476257
type1,1426501632,1515476317
type1,1428205568,1515476377
type1,1428369408,1515476437
"""
df = pd.read_csv(io.StringIO(data))


# unixtime を Indexに設定
df = df.set_index('unixtime', drop=True)

# centerのデータを抜き出す
result = df.loc[df['type'] == 'center', 'value'].rename('center')
for name in ['type1', 'type2', 'type3']:
    # type1～3のデータをcenterのIndexに近いデータで再構築
    new_col =  df.loc[df['type'] == name, 'value'].reindex(result.index, method='nearest').rename(name)
    # 結合
    result = pd.concat([result, new_col], axis=1)

# 後処理（必用であれば）
# datetime をIndexから外し、Indexを振りなおす
result = result.reset_index()

print(result)
#      unixtime  center       type1  type2  type3
# 0  1515475613      76  1440903168     97   8887
# 1  1515475913      77  1421123584     98   8888
# 2  1515476213      78  1426640896     99   8889
```

関連した質問