前提・実現したいこと
「year」と「records」という2列からなるCSVをpandasで読み込み、表示したいと思っています。しかし、read_csvを使ったところ、正しく読み込まれず、NaNの入った列が勝手に入るようになりました。同様のファイルが大量にあるため、できれば一括で直したいと思っています。
発生している問題・エラーメッセージ
現在、CSVをpandasで読み込むと、以下のような表示となります。
本来はyearとrecordsが列名であり、それぞれの列には4ケタの西暦、1ケタ~4ケタの数字が入るはずですが、このようになります。
これまではread_csvでCSVを読み込んでも、このような表示崩れが発生したことはありませんでした。しかし昨日、CSVファイルの冒頭に入っていた「・ソ」という文字列が邪魔になり、テキストエディタで開いて削除したところ、このようになってしまいました。なお、このファイルだけでなく、新たに作ったCSVファイルも同様にNaNが入ってしまいます。
該当のソースコード
Python3
1import pandas as pd 2df = pd.read_csv('ファイルのパス', 'r') 3df
試したこと
カンマの部分で正しく区切られないようなのでread_csvにsep=','を追加したところ、エラーが出て弾かれてしまいました。また、新しいテキストファイルに現在の内容をコピペをしてCSVで保存する、Excelで読み込んで新たなファイルにコピペしてCSVで保存するなども試しましたが、いずれのやり方で作ったファイルもread_csvでは正常に読み込まれません。
補足情報(FW/ツールのバージョンなど)
普段はWindows10でJupyterNotebookを使っています。Pythonのバージョンは3.7.3です。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。