質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.39%
Unicode

Unicodeはエンコーディングの標準規格です。1つの文字コード体系で多国語の表現を可能にすることを目指して作られています。

パス

パス(path)はファイルシステムの場所(階層)を明示したものです。

文字コード

文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

3回答

23619閲覧

【Python】変数に格納した日本語文字列をパスに用いると文字化けしてしまう

netz-eng

総合スコア105

Unicode

Unicodeはエンコーディングの標準規格です。1つの文字コード体系で多国語の表現を可能にすることを目指して作られています。

パス

パス(path)はファイルシステムの場所(階層)を明示したものです。

文字コード

文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

1グッド

2クリップ

投稿2020/08/07 05:02

編集2020/08/07 06:06

日本語文字列を格納した変数を、パスに使用したい

Pythonにて、ファイル操作を行うGUIを作っています。

ダイアログボックスで指定したフォルダの名前を変数に格納したあと、そのフォルダに対して操作を行うとき、フォルダ名に日本語が含まれているとフォルダ名が文字化けし、以下のようなエラーが発生します。

当該のフォルダはきちんと存在しています。

調べたところ、文字列では

python

1t = u"abc"

のように書けばutf-8型(unicode型?)で変数を扱えるようですが、これをダイアログボックスから取得したフォルダ名にどのように作用させればいいか検討がつきません。

どなたかお詳しい方、ご回答よろしくお願いします。

ソースコード

python

1import tkinter as tk 2import os 3 4path = os.getcwd() 5dir = path 6 7win = tk.Tk() 8win.resizable(False, False) 9 10#中略 11 12fle = filedialog.askdirectory(initialdir = dir, title="保存先フォルダの選択") 13img = "sample.tiff" 14gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) 15gray_path = fle + "gray.tiff" 16cv2.imwrite(gray_path, gray) 17 18win.mainloop()

発生しているエラーメッセージ

TIFFOpen X:/~文字化けしたフォルダ名~~~: No such file or directory.

追記

ご指摘いただいた通り、当該のコードを抜粋して記載しました。
メニューからダイアログボックスを開き、指定したファイル名をテキストボックスに挿入し、その文字列を変数fle取得しています。

このファイル名を格納した変数tに日本語が含まれているとき、fleをファイル名に含む部分の操作で上のエラーが発生してしまいます。

補足情報(FW/ツールのバージョンなど)

Windows10
Python 3.8.3

120206200105を押しています

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Orlofsky

2020/08/07 05:11

MS Office 辺りと違って、無用なトラブルを避けるために、通常、マルチバイト文字、半角カタカナなどはパスに含めないのが吉です。 もちろん、自己責任を理解した上で地雷原のど真ん中を突っ切るのは自由です。
y_waiwai

2020/08/07 05:20

コードを提示しましょう
netz-eng

2020/08/07 05:20

目に留めていただき、ありがとうございます。 基本的には私もそうしたいのですが、いま作っているアプリは、完成すればPCが苦手な後輩も使っていくことになるものでして……。 やはり英語よりも日本語でつけたフォルダ名のほうが分かりやすいので、そういった場合でも対応できるよう、日本語を含むパスでも通せるような仕様にしたい所存です。 何か関連の事柄にお心当たりがある場合は、お力添えいただけると嬉しいです。
meg_

2020/08/07 05:36

どんな文字が文字化けしているのですか?
netz-eng

2020/08/07 06:08

> y_waiwaiさん ご指摘ありがとうございます。 ソースコードを質問文に追加しました。 > meg_さん 目に留めていただき、ありがとうございます。 文字化けしているのは「新しいフォルダー」など、日本語のフォルダ名です。
otn

2020/08/07 06:10

具体的にお願いします。 一般論だと、「ちゃんと作れば出来ます」としか言えない。
otn

2020/08/07 06:19 編集

> 日本語のフォルダ名です。 それは最初からわかっている。 何という文字列がどう化けた(と思っている)のか。
netz-eng

2020/08/07 06:40

> otnさん ご指摘ありがとうございます。 「新しいフォルダー」が、「譁ー縺励>繝輔か繝ォ繝€繝シ」に化けている状況です。
Orlofsky

2020/08/07 06:44

フォルダ名の名前を変更して文字化けを解消できますか?
netz-eng

2020/08/07 06:55

> Orlofskyさん 目に留めていただき、ありがとうございます。 フォルダ名を半角英数字にしたところ、問題なく作動しました。 ですが、フォルダ名が日本語の場合は他の名前でも文字化けしてしまいます。 私としては、日本語フォルダ・ファイル名にも対応できる形で実装したいのですが……。何かお心当たりあれば、よろしくお願いします。
guest

回答3

0

ベストアンサー

そもそもOpenCVが日本語を含むパスに対応していないと思われます。
参考:OpenCVでJPEG画像の読み取りができません。

投稿2020/08/07 07:46

can110

総合スコア38337

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

netz-eng

2020/08/07 08:11

ご回答ありがとうございます。 なんと、そうだったんですね……、試行中に気づくべきでした。 リンクを参考に、エラー解消をさせていただきます。
guest

0

文字列がSJISで取得できているようなので、UTF-8にエンコーディングを変換すると多分良いです。

投稿2020/08/07 07:05

otn

総合スコア85607

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

netz-eng

2020/08/07 08:09 編集

ご回答ありがとうございます。 以下の二通りの行を追加して試してみましたが、エラーが発生してしまいました。 ① fle = fle.encode("utf-8").decode("utf-8") エラー内容は質問文と同一 ② fle = fle.encode("utf-8") TypeError: can't concat str to bytes ①の方法でもエラーが出るのは、can110さんのご回答の通り、どうやらOpenCVライブラリの問題のようです。 参考URLを張っていただいたので、そちらを参考にしてみようかと思います。
otn

2020/08/07 10:00

それでは、エンコーディング変換は出来ないのでは? ①何もしていないのと同じ ②strとbytesの区別 私もよく知りませんが、codecsライブラリを使うようです。 Python日本語不自由。 別にOpenCVが日本語対応してないわけじゃなくて、返す文字列がSJISなので、Pythonで扱いにくいというだけでしょう。
netz-eng

2020/08/07 15:36

①、②ともに、仰る通りです(汗) 初学者の自分には根本的な原因がどこにあるのかは計りかねますが、can110さんに教えていただいたリンクを参考に解決できたので、結果良しかな、と思います。 色々と知恵を絞ってくださり、ありがとうございました。
guest

0

あまり詳しくは無いですが、回答させていただきます。間違っていたら、申し訳ありません。

文字化け解読ツール「もじばけらった」を使って見てみると、SJIS(Shift_JIS)になってしまっているようなので、otnさんがおっしゃている通りUTF-8に変換すればいいわけです。

Python

1fle.encode('utf-8') 2#若しくは 3fle.encode()

とすると変換できるようです。

「傷口に貼るアレ」で例える文字コード処理 ~python3で文字化けファイル名操作~がとてもわかりやすかったです。
.encodeについてはPythonで文字コードを変換する方法【初心者向け】に詳しく書かれています。
以上2つのサイトを参考にさせていただきました。ありがとうございました。

投稿2020/08/07 07:34

glyzinieh

総合スコア222

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

netz-eng

2020/08/07 08:06

ご回答ありがとうございます。 リンク助かります。 他の方の回答への返信でも書きましたが、お教えいただいた方法ではうまくいきませんでした。 can110さんのご回答を見るに、どうもOpenCVライブラリの問題のようです。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.39%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問