質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

2回答

1325閲覧

python csvが文字化けする

ruizu

総合スコア35

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2020/09/15 10:38

編集2020/09/15 10:40

前提・実現したいこと

csvを問題なく読み込む
excel上では問題なく日本語が表示されます。

発生している問題

サソID #譌・譛ャ隱(蜴滓枚) #繧縺輔@縺譌・譛ャ隱 \ 0 1 隱ー縺御ク逡ェ縺ォ逹縺上°遘√↓縺ッ蛻縺九j縺セ縺帙s縲 隱ー縺御ク逡ェ縺ォ逹縺上°遘√↓縺ッ蛻縺九j縺セ縺帙s縲 1 2 螟壹¥縺ョ蜍慕黄縺御ココ髢薙↓繧医▲縺ヲ貊縺シ縺輔l縺溘 螟壹¥縺ョ蜍慕黄縺御ココ髢薙↓繧医▲縺ヲ谿コ縺輔l縺溘 2 3 遘√ッ繝繝九せ驛ィ蜩。縺ァ縺吶 遘√ッ繝繝九せ驛ィ蜩。縺ァ縺吶 3 4 繧ィ繝溘ッ蟷ク縺帙◎縺縺ォ隕九∴縺セ縺吶 繧ィ繝溘ッ蟷ク縺帙◎縺縺ォ隕九∴縺セ縺吶 4 5 縺薙ョ莠句ョ溘r蠢縺ォ逡吶a縺ヲ縺翫>縺ヲ荳九&縺縲 縺薙ョ莠句ョ溘r隕壹∴縺ヲ縺翫>縺ヲ縺上□縺輔>縲

実際のcsv中身

ID #日本語(原文) #やさしい日本語 #英語(原文) 1 誰が一番に着くか私には分かりません。 誰が一番に着くか私には分かりません。 i can 't tell who will arrive first . 2 多くの動物が人間によって滅ぼされた。 多くの動物が人間によって殺された。 many animals have been destroyed by men .

該当のソースコード

python

1import pandas as pd 2import codecs 3with codecs.open("57C45810.csv", "r", "shift_jis", "ignore") as file: 4 df = pd.read_table(file, delimiter=",") 5 print(df.head())

試したこと

encoding="shift_jis" encoding='cp932'

補足情報(FW/ツールのバージョンなど)

オープンに配布されているデータなのでデータのダウンロードリンクを張ります

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

cateye

2020/09/15 11:04

shift_jisをUTF-8にしたらどうでしょう?
guest

回答2

0

自己解決

UTF-8 にて自己解決しました

投稿2020/09/15 11:12

ruizu

総合スコア35

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

Python

1import pandas as pd 2import codecs 3 4with codecs.open("57C45810.csv", "r", "utf-8", "ignore") as file: 5 df = pd.read_table(file, delimiter=",") 6 print(df.head()) 7

投稿2020/09/15 11:06

meg_

総合スコア10760

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問