前提・実現したいこと
あるデータをforで並び替えて一行のレコードに変換して、出力用のデータフレームに追加したいと考えています。現在、pandas.DataFrameでs出力用のデータフレームを作成し、for文のなかで追加用のseriesをつくり、appendで上記のDataFrameにSeriesを追加するようにしているのですが、処理速度が遅く困っております。どうすれば高速化できるかアイデア等ご教授頂けるとありがたいです。
該当のソースコード
import pandas as pd f=pd.DataFrame([1,2,3],[4,5,6]) df= pd.DataFrame(index=[’ 'A','B']) for idx,row in f.itrrows(): S=pd.Series(index=['A','B']) S['A']=row[1] S['B']=row[2] df=df.append(S,ignore_index=True)
※実際のデータのイメージ
元データ
|列1|列2|列3|列4|
|:--|:--:|--
|A|B1|C|D|
| |B2| |E|
を
|列1|列2|列3|列4|列5|
|:--|:--:|--:|
|A|B1 B2|C|D|E|
に成型する
補足情報(FW/ツールのバージョンなど)
Python3.6
ここにより詳細な情報を記載してください。
回答2件
あなたの回答
tips
プレビュー