🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
ASCII

ASCIIは、米国規格協会(ANSI)が制定したコンピューターの情報交換のための文字コードの一つ。アルファベットや数字などを1文字当たり7ビットで表します。英数字を表示する文字コードの中で最も高い互換性を持ち、多くの通信機器に利用されています。

JSON

JSON(JavaScript Object Notation)は軽量なデータ記述言語の1つである。構文はJavaScriptをベースとしていますが、JavaScriptに限定されたものではなく、様々なソフトウェアやプログラミング言語間におけるデータの受け渡しが行えるように設計されています。

文字コード

文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

2回答

10014閲覧

excelから日本語文字列をpythonを使って読み出したい

pokemonta

総合スコア170

ASCII

ASCIIは、米国規格協会(ANSI)が制定したコンピューターの情報交換のための文字コードの一つ。アルファベットや数字などを1文字当たり7ビットで表します。英数字を表示する文字コードの中で最も高い互換性を持ち、多くの通信機器に利用されています。

JSON

JSON(JavaScript Object Notation)は軽量なデータ記述言語の1つである。構文はJavaScriptをベースとしていますが、JavaScriptに限定されたものではなく、様々なソフトウェアやプログラミング言語間におけるデータの受け渡しが行えるように設計されています。

文字コード

文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/11/16 07:17

編集2020/11/16 08:32

Excelシートから日本語文字を読み取りたいと思っています。
openpyxlを使って、読み出しに成功したものの
sheets.cell(row=i, 1).value → Nameから読み込んだ日本語を正しく
表示させる方法をご教示頂けないでしょうか?
JSONには、日本語が出力されるようにしたいです。
パターン1・・・ensure_ascii=True →ユニコードが表示される
パターン2・・・ensure_ascii=false →文字化けする

【パターン1】

python

1dest10 = dict() 2book = openpyxl.load_workbook('C:\temp\abc.xls) 3sheets = sheet1 4path_w = 'out' 5 6 7for i in range(100): 8 Name = sheets.cell(row=i, 1).value 9 10 dest10 = { 11 "Name " : Name 12 } 13 14with open(path_w, mode='a') as f: 15 json_str = json.dumps(dest11, sort_keys=False, ensure_ascii=True, indent=4) 16 f.write(json_str + '\n')

json

1 { 2 "Name " : \u4fdd\u8b77\・・・ 3 }

【パターン2】

python

1dest10 = dict() 2book = openpyxl.load_workbook('C:\temp\abc.xls) 3sheets = sheet1 4path_w = 'out' 5 6 7for i in range(100): 8 Name = sheets.cell(row=i, 1).value 9 10 dest10 = { 11 "Name " : Name 12 } 13 14with open(path_w, mode='a') as f: 15 json_str = json.dumps(dest11, sort_keys=False, ensure_ascii=false, indent=4) 16 f.write(json_str + '\n')

json

1 { 2 "Name " : �ی�M 3 }

★Nameをprintすると日本語がちゃんと代入されていることが
確認できます。ファイルに出力すると上記結果となります。

★with open(path_w, mode='a',encoding='Shift_JIS') as f:としても
文字化けが解消しません

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

can110

2020/11/16 09:28

出力されたファイル内容はどのような手段(エディタ)で確認しているでしょうか? またそのファイルの文字コードは何になっているでしょうか?
pokemonta

2020/11/16 09:38

utf-8のテキストが出力されますので vscodeで中身を確認しました。 ちなみにencoding='Shift_JISを指定しても 同じでした
guest

回答2

0

vscodeで中身を確認しました。

ちなみにencoding='Shift_JISを指定しても
同じでした

VSCodeでテキストファイルを開くとデフォルトのUTF-8で開かれます。
したがってShift-JISをそのまま開くと文字化けします。
メモ帳などのデフォルトでShift-JISで開けるエディタで確認するか、[VSCode]Visual Studio CodeでShift-JISのファイルを開くで紹介されている手段で明示的にShift-JISを指定して開いてください。

投稿2020/11/16 11:05

can110

総合スコア38341

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

ベストアンサー

提示されているコードでは、そもそも動かないので、そのあたり不安ではありますが、

以下のコードでSheet1のCell(1,1)にある日本語がutf-8もしくはsjisとしてテキストに出力されています。
OSはWindows10です。

とりあえず、これで試してみて、うまくいくようであれば、これをベースに拡張ください。

python

1import openpyxl 2import json 3 4book = openpyxl.load_workbook('sample.xlsx') 5sheet = book.get_sheet_by_name('Sheet1') 6 7datax = {} 8 9v = sheet.cell(1, 1).value 10datax['データ'] = v 11json_str = json.dumps(datax, ensure_ascii=False, indent=4) 12 13with open('out.txt', 'w', encoding='utf-8') as f: 14 f.write(json_str) 15
  • enshure_asciiはFalseにしないと「\u30c7\u30fc\u30bf」のような表示になります。
  • ファイルをopenするときのencodingに指定した文字コードでファイルができます。sjisを指定すればShift-JISになります。

出力ファイルはこんな感じです。

text

1{ 2 "データ": "入ってます" 3}

投稿2020/11/16 10:45

TakaiY

総合スコア13748

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

pokemonta

2020/11/16 10:53

ですよね。 僕のコードもそのようなコードでやってるんですけどね
TakaiY

2020/11/16 11:02

同じコードを動かすとどうなりますか?(指定するセルは日本語の入っているところがいいですけど) また、質問にもありますが、化けているときのモジコードは何ですか? 文字コードはどうやって確認していますか?
pokemonta

2020/11/16 11:14

【成功パターン】 with open('out.txt', 'a', encoding='shift-jis') as f: f.write(json_str) 【失敗パターン】 path_w = 'oil' with open(path_w , 'a', encoding='shift-jis') as f: f.write(json_str) ファイル名は、変数したらだめみたいです。
TakaiY

2020/11/16 12:21

解決済みになってますけど、変数にしたらだめというようなことはありえないです。 モードが'a'の追記になっているところが気になります。 今回、文字化けが問題ですので、追記ではなく、上書き='w'にするのがお勧めです。
pokemonta

2020/11/17 03:57

aでもwでも行けました
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問