Pandasにおけるデータ加工処理について

前提・実現したいこと

PythonのPandasにおけるデータ加工処理についての質問です。

例えばIrisデータにおいて
sl, sw, pl, pw, Sp
5.1,3.5,1.4,0.2,Iris-setosa
4.9,3.0,1.4,0.2,Iris-setosa
4.7,3.2,1.3,0.2,Iris-setosa
7.0,3.2,4.7,1.4,Iris-versicolor
6.4,3.2,4.5,1.5,Iris-versicolor
6.9,3.1,4.9,1.5,Iris-versicolor
6.3,3.3,6.0,2.5,Iris-virginica
5.8,2.7,5.1,1.9,Iris-virginica
7.1,3.0,5.9,2.1,Iris-virginica

※カラムはSepal.Length Sepal.Width Petal.Length Petal.Width Species

というデータに対して、Soeciesを横軸にしてslの値をだけを中身にしたいと思っています。すなわち
Iris-setosa, Iris-versicolor, Iris-virginica
5.1, 7.0, 6.3
4.9, 6.4, 5.8
4.7, 6.9, 7.1

という形にしたいです。どうすればよいでしょうか。

試したこと

stack, unstackとか試しましたが、うまくいかず悩んでいます。

行動規範の内容に同意します

回答1件

ベストアンサー

こんな感じでしょうか。

Python
1import pandas as pd
2import io
3
4data = """sl, sw, pl, pw, Sp
55.1,3.5,1.4,0.2,Iris-setosa
64.9,3.0,1.4,0.2,Iris-setosa
74.7,3.2,1.3,0.2,Iris-setosa
87.0,3.2,4.7,1.4,Iris-versicolor
96.4,3.2,4.5,1.5,Iris-versicolor
106.9,3.1,4.9,1.5,Iris-versicolor
116.3,3.3,6.0,2.5,Iris-virginica
125.8,2.7,5.1,1.9,Iris-virginica
137.1,3.0,5.9,2.1,Iris-virginica
14"""
15
16df = pd.read_csv(io.StringIO(data), skipinitialspace=True)
17
18df2 = df.groupby('Sp').apply(lambda d: d['sl'].reset_index(drop=True)).T
19print(df2)
20# Sp  Iris-setosa  Iris-versicolor  Iris-virginica
21# sl
22# 0           5.1              7.0             6.3
23# 1           4.9              6.4             5.8
24# 2           4.7              6.9             7.1