以下のようなCSVデータがあるとします。
【CSVデータ】 ID 氏名 生年月日 電話番号 00001,山田太郎,1980-01-01,09012345678 00002,佐藤花子,1982-11-11,09087654321 00001,山田太郎,1980-01-01,09012345678- 00003,田中桃子,1975-12-22,09012346666
【やりたいこと】
pythonでCSVデータの重複データ抽出及び、重複したCSVの行番号を取得したいです。
【想定する取得結果】
00001,山田太郎,1980-01-01,09012345678
2行目,4行目
【MEMO】
pandasを使用したらINDEXしかとれないので、他に方法があるのか質問させていただきました。
INDEXだからヘッダ分+1すればいいじゃないかという話もあるかもしれませんが。。
提供されるCSVがヘッダ有と無、両方でくる可能性がありまして、問題となったのは行番号の取得です。
実装方法を検討するうえで、事前にCSVヘッダ有無を調べて後からヘッダがあるならINDEXに足す方法と
CSVの行番号そのままとる方法はないかと色々調べておりました。
>INDEXしかとれないは書き方に誤りがありました。
重複データもとれております。すみません。
「提供されるCSVがヘッダ有と無、両方でくる可能性」
こういう、回答に影響を与える情報は、質問文に記載下さい。また、何をもってヘッダかどうかを判定するのか、コード以前に日本語として定義お願いします。
回答3件
あなたの回答
tips
プレビュー