Python 内の pandas に関する質問です。
非常に初歩的な質問で申し訳ありません。
上記のようなcsvファイルがあり、1つのシリアル番号別のcsvファイルを作成したく考えております。
データに関してはこの下に10万行ほどあり、1つのシリアル番号につき、20~30行ほどのデータがございます。
import
1import pandas as pd 2 3df = pd.read_csv('----------.csv', encoding='cp932' ) 4df2 = df["シリアル番号"].drop_duplicates() 5 6df4 = (df[["日付", "日時", "目標番号", "シリアル番号"]]) 7 8df5 = (df4[df4["シリアル番号"] == df2 ])
2行目でcsvファイルを読み込み、
3行目で、csvファイル内の重複したシリアル番号を処理しました。
ここで、シリアル番号を1つずつ取り出したつもりです。
4行目で、同csvファイル内から必要な列を取り出し、
5行目で、3行目で取り出した重複の無いシリアル番号をそれぞれ代入し、
シリアル番号別に、4行目で取り出した特定の行に関するcsvファイルを作成したく考えています。
【期待する結果】
元のcsvファイル内の、重複したデータを削除したいわけではございません。
シリアル番号別のcsvファイルを、シリアル番号ごとに1つずつ作成したく考えております。
この先どう処理すれば良いのか分からず苦戦しております。
for文を使うべきだと思うのですが。。。
お力を貸して頂けませんでしょうか?