前提・実現したいこと
kaggleからダウンロードしたcsvファイルの中身を見ようとしています。
Excelで開くと文字化け状態のためJupyter Notebook上でPythonで閲覧しようとしたのですが、ファイルの読み込みが上手くいきません。
発生している問題・エラーメッセージ
UnicodeDecodeError: 'utf-8' codec can't decode bytes in position 215323-215324: invalid continuation byte
該当のソースコード
Python
1import pandas as pd 2JPvideos = pd.read_csv('JPvideos.csv',encoding='utf-8')
試したこと
cp932
utf-8, utf-8-sig
shift-jis
iso2022_jp
euc_jp
等の一通りの文字コードは試しましたが原因は別にあるようです。
JPvideos = pd.read_csv('JPvideos.csv',engine="python")
の形式で実行した場合は、読み込みは可能ですが文字化けのままの状態で
データセットが格納されてしまいます。
回答1件
あなたの回答
tips
プレビュー