質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
ファイル

ファイルとは、文字列に基づいた名前又はパスからアクセスすることができる、任意の情報のブロック又は情報を格納するためのリソースです。

UTF-8

UTF-8は8ビット符号単位の文字符号化形式及び文字符号化スキームです。データ交換方式、ファイル形式としては、一般的にUTF-8が使われる傾向があります。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

2回答

1121閲覧

エンコードが同じなのにUnicodeDecodeError出てしまう

nomaluu

総合スコア34

ファイル

ファイルとは、文字列に基づいた名前又はパスからアクセスすることができる、任意の情報のブロック又は情報を格納するためのリソースです。

UTF-8

UTF-8は8ビット符号単位の文字符号化形式及び文字符号化スキームです。データ交換方式、ファイル形式としては、一般的にUTF-8が使われる傾向があります。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2021/08/21 13:36

編集2021/08/22 07:47

修正内容

Sample.csvの写真の追加
「両方」が何と何かについての記載の追加
「別コード」の訂正

質問の経緯

csvファイルを読み込むコードを実行してみるとUnicodeDecodeErrorが出てしまい、
解決しようと調べても理解できず、自力では解決できないと考えたため、質問しました。
以前にテキストファイルの文字が文字化けみたいになった際はFiles: Auto Guess Encoding をオンにしてできましたが、今回はできず、エンコードが「Sample.py」と「Sample.csv」の両方ともにutf-8なのにエラーが出てしまいます。

コード

python

1コード#import csv 2f = open('Sample.csv','r') 3 4rd = csv.reader(f) 5 6for row in rd: 7 for col in row : 8 print(col,end = ',') 9 print() 10f.close()

csvファイル

東京,鉛筆,25
東京,消しゴム,30
名古屋,ノート,56
大阪,定規,100
福岡,ノート,73

写真

Sample.csv
Sample.py

環境

python3.9.5
エディタ:vscode
windows10

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2021/08/21 13:42

Sample.csvの文字コードは本当にutf-8ですか?
nomaluu

2021/08/21 13:48

以前このcsvファイルの内容を書いて作った際、文字化け?みたいになったしまい、そこでFiles: Auto Guess Encodingを導入したら治りました。Sample.csvの写真を掲載させていただきます。
quickquip

2021/08/21 13:54

エラーのTracebackを省略せずに質問に載せましょう。
nomaluu

2021/08/21 13:59

写真のターミナルでよろしいでしょうか?
ikadzuchi

2021/08/21 14:43

> 以前に別のコードでエンコードのエラーが出た際はFiles: Auto Guess Encoding をオンにしてできました 別のコードとはどのようなコードですか? Files: Auto Guess Encodingをオンにしたとは、何のファイルに対してオンにしたのですか? できましたとは、何ができたのですか? > エンコードが両方ともutf-8 両方ともとは、何と何ですか?
nomaluu

2021/08/22 07:39

> 以前に別のコードでエンコードのエラーが出た際はFiles: Auto Guess Encoding をオンにしてできました 別のコードとはどのようなコードですか? すいません、別のコードじゃなくてテキストファイルでした。訂正します。それを読み込んだ際、テキストファイルの文字が文字化けみたいになり、Files: Auto Guess Encodingをオンにしたところ、治りました。 ------------------------------------------------------------------------------- >Files: Auto Guess Encodingをオンにしたとは、何のファイルに対してオンにしたのですか? Files: Auto Guess Encodingは自動だと思うので、「何に」というのはわかりません。 --------------------------------------------------------------------- > エンコードが両方ともutf-8 両方ともとは、何と何ですか? 二つの画像の「Sample.py」と「Sample.csv」のファイルです
guest

回答2

0

ベストアンサー

Files: Auto Guess Encodingは、VSCodeのオプションであってpythonがファイルを読み込む場合には何の関係もありません。

公式ドキュメント open に書かれているように、

テキストモードでは、encoding が指定されていない場合に使われるエンコーディングはプラットフォームに依存します:locale.getpreferredencoding(False) を使って現在のロケールエンコーディングを取得します。

です。Linuxの場合には'utf-8'、Windowsの場合には'cp932'となります。

Pythonからファイルを読み込む場合は、ishina_yumさんが書かれているようにencoding="utf-8"をつけましょう。

投稿2021/08/21 14:51

ppaul

総合スコア24666

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

f = open('Sample.csv','r')

にencoding指定を付けましょう。

f = open('Sample.csv','r', encoding="utf-8")

投稿2021/08/21 14:07

ishina_yum

総合スコア509

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

nomaluu

2021/08/21 14:13

回答ありがとうございます。できました。 なぜ、両方ともutf-8なのに指定するとできたのかわかりません
ishina_yum

2021/08/21 14:28

ファイル入出力の文字エンコーディングはWindows版のPythonではcp932になっているものじゃないんですかね。 他の言語でもそうですけれど、大概の場合はソースファイルを記述している文字エンコーディングと、ファイル入出力で使用するデフォルトの文字エンコーディングは別物です。 尚、今回の質問文にあるソースコードはASCII文字しか使っていないので、Shift-JISかUTF-8かの区別はつかないと思います。
nomaluu

2021/08/22 07:44

ありがとうございます。わかりました
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問