pandasのread_csvで正しくデータが読み込めずNaN列ができます

前提・実現したいこと

「year」と「records」という2列からなるCSVをpandasで読み込み、表示したいと思っています。しかし、read_csvを使ったところ、正しく読み込まれず、NaNの入った列が勝手に入るようになりました。同様のファイルが大量にあるため、できれば一括で直したいと思っています。

発生している問題・エラーメッセージ

現在、CSVをpandasで読み込むと、以下のような表示となります。

本来はyearとrecordsが列名であり、それぞれの列には4ケタの西暦、1ケタ～4ケタの数字が入るはずですが、このようになります。

これまではread_csvでCSVを読み込んでも、このような表示崩れが発生したことはありませんでした。しかし昨日、CSVファイルの冒頭に入っていた「・ｿ」という文字列が邪魔になり、テキストエディタで開いて削除したところ、このようになってしまいました。なお、このファイルだけでなく、新たに作ったCSVファイルも同様にNaNが入ってしまいます。

該当のソースコード

Python3
1import pandas as pd
2df = pd.read_csv('ファイルのパス', 'r')
3df

試したこと

カンマの部分で正しく区切られないようなのでread_csvにsep=','を追加したところ、エラーが出て弾かれてしまいました。また、新しいテキストファイルに現在の内容をコピペをしてCSVで保存する、Excelで読み込んで新たなファイルにコピペしてCSVで保存するなども試しましたが、いずれのやり方で作ったファイルもread_csvでは正常に読み込まれません。

補足情報（FW/ツールのバージョンなど）

普段はWindows10でJupyterNotebookを使っています。Pythonのバージョンは3.7.3です。

行動規範の内容に同意します

回答1件

自己解決

read_csvで読み込む時の文法が間違っていたことに気づきました。以下のとおりにしたら読み込めました。

Python3
1import pandas as pd
2df = pd.read_csv('ファイルのパス')
3df

投稿2019/11/05 23:54

fujiko20

総合スコア19

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

『🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中！

＼teratail特別グッズやAmazonギフトカード最大2,000円分が当たる！／