###前提・実現したいこと
Python2系、pandasを使用して、以下のデータ加工処理を実現したいです。
teratail、プログラミング初心者で恐縮ですが、もしご存知の方いらっしゃいましたらご教示いただけますと幸いです。
以下の2.データサンプルの<加工前>CSVファイルを、<加工後>の状態(CSVファイルや、リスト、DataFrameの状態)にしたいです。
**1. 処理過程イメージ **
①カラム1でグルーピング
②カラム2でソート(昇順)
③カラム2をソートした順番に、"_"(アンスコ)でつなげて、ひとつの文字列にする。
※グルーピングした結果、1行のみだった場合(以下のAのパターン)、カラム2は特に加工しない。
2. データサンプル
<加工前>
カラム1,カラム2
A,1
B,1
B,2
C,1
C,2
C,3
<加工後>
A,1
B,1_2
C,1_2_3
###試したこと
私が試している内容についてですが、以下の<加工前>CSVをDataFrameにし、pandasのgroupby関数を使用して、pandas.core.groupby.DataFrameGroupByオブジェクトにした上で、そのオブジェクトに用意されている関数を利用して、どうにか加工できないか模索している状況です。
###補足情報(言語/FW/ツール等のバージョンなど)
以下APIに記載の関数を利用できないか模索していますが、糸口が掴めていない状況です。
https://pandas.pydata.org/pandas-docs/stable/api.html
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2017/08/31 05:15