前提・実現したいこと
csvを問題なく読み込む
excel上では問題なく日本語が表示されます。
発生している問題
サソID #譌・譛ャ隱(蜴滓枚) #繧縺輔@縺譌・譛ャ隱 \ 0 1 隱ー縺御ク逡ェ縺ォ逹縺上°遘√↓縺ッ蛻縺九j縺セ縺帙s縲 隱ー縺御ク逡ェ縺ォ逹縺上°遘√↓縺ッ蛻縺九j縺セ縺帙s縲 1 2 螟壹¥縺ョ蜍慕黄縺御ココ髢薙↓繧医▲縺ヲ貊縺シ縺輔l縺溘 螟壹¥縺ョ蜍慕黄縺御ココ髢薙↓繧医▲縺ヲ谿コ縺輔l縺溘 2 3 遘√ッ繝繝九せ驛ィ蜩。縺ァ縺吶 遘√ッ繝繝九せ驛ィ蜩。縺ァ縺吶 3 4 繧ィ繝溘ッ蟷ク縺帙◎縺縺ォ隕九∴縺セ縺吶 繧ィ繝溘ッ蟷ク縺帙◎縺縺ォ隕九∴縺セ縺吶 4 5 縺薙ョ莠句ョ溘r蠢縺ォ逡吶a縺ヲ縺翫>縺ヲ荳九&縺縲 縺薙ョ莠句ョ溘r隕壹∴縺ヲ縺翫>縺ヲ縺上□縺輔>縲
実際のcsv中身
ID #日本語(原文) #やさしい日本語 #英語(原文) 1 誰が一番に着くか私には分かりません。 誰が一番に着くか私には分かりません。 i can 't tell who will arrive first . 2 多くの動物が人間によって滅ぼされた。 多くの動物が人間によって殺された。 many animals have been destroyed by men .
該当のソースコード
python
1import pandas as pd 2import codecs 3with codecs.open("57C45810.csv", "r", "shift_jis", "ignore") as file: 4 df = pd.read_table(file, delimiter=",") 5 print(df.head())
試したこと
encoding="shift_jis" encoding='cp932'
補足情報(FW/ツールのバージョンなど)
オープンに配布されているデータなのでデータのダウンロードリンクを張ります
shift_jisをUTF-8にしたらどうでしょう?
回答2件
あなたの回答
tips
プレビュー