Pythonにて、pandasのdataframeでCSVを読み込んで、
最終列以外を除いて、
対象データ
列1 | 列2 | 列3 | 列4 |
---|---|---|---|
あ | え | あ | い |
う | え | え | お |
か | あ | き | く |
処理後:
1行目:"あえあ"
2行目: "うええ"
3行目: "かあき"
という風なリストを作りたい場合。
下記のような力技のコードを書きました。
python
1[import類略] 2#pd = pandas 3 data_f = pd.read_csv("csv/csvfile.csv") 4 wrk_data_f = [] 5 for i in range(len(data_f)): 6 wrk_data_f.append(''.join(map(str,data_f[list(data_f.columns[0:len(data_f.columns) -1])].values.tolist()[i])))
これでやると何万件ものデータがある場合、途方もない時間を食ってしまいます。
何か関数等でこの処理を実現できるようなライブラリや、処理方法はありますでしょうか?
(CSVを作る段階で、文字列にしておくことも可能ですが、あくまで読み込み後での処理を想定しております)
ご教授お願い致します。
追記 '2017/9/11 18:47
データの配列が可変の場合を想定しています。
(例示として列を4つにしております。)
※質問文を編集させていただきました。
回答2件
下記のような回答は推奨されていません。
このような回答には修正を依頼しましょう。
2017/09/11 23:34