質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

5613閲覧

Pythonのプログラムでフォルダを圧縮し、その後それを手動解凍すると日本語名フォルダ(ファイル)が文字化けしている

yuuta123

総合スコア10

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2018/11/02 09:18

前提・実現したいこと

Pythonプログラミング逆引き大全 313の極意
出版社: 秀和システム (2018/4/1)

P248
自動バックアッププログラムを作成する

を、日本語フォルダを含む状態で文字化けさせずに動かしたいです。
(が、圧縮されたものを解凍してみると、日本語名フォルダ(および日本語名ファイル)について文字化けしています)

発生している問題・エラーメッセージ

プログラムを動かすことにより圧縮対象となるフォルダ
C:\mydata
配下には、実際には以下のサブフォルダがあります。
test
テスト

該当のプログラムを動かし、プログラムが生成したzipファイルを解凍すると、日本語名フォルダ(および日本語名ファイル)の部分について以下のようにフォルダ名が文字化けしてしまいます。日本語ではない半角英字のフォルダ名は問題ありませんでした。

test
繝・せ繝・

プログラムによる圧縮・圧縮したものを解凍したのちに生成された
繝・せ繝・
という文字化けした名前のフォルダが、圧縮前は
テスト
という名前のフォルダでした。

該当のソースコード

Python

1import zipfile, os # zipfileとosモジュールのインポート 2 3''' 4指定されたフォルダーをZIPファイルにバックアップする関数 5folder : バックアップするフォルダーのパス 6''' 7def save_zip(folder): 8 # folderをルートディレクトリからの絶対パスにする 9 folder = os.path.abspath(folder) 10 11 # ZIPファイル末尾に付ける連番 12 number = 1 # 初期値は1 13 14 # ①バックアップ用のZIPファイル名を作成する部分 15 # ZIPファイル名を作成して、既存のバックアップ用ZIPファイル名を出力 16 while True: 17 # 「ベースパス_連番.zip」の形式でZIPファイル名を作る 18 zip_filename = os.path.basename(folder) + '_' + str(number) + '.zip' 19 # 作成したZIPファイル名を出力 20 print("zip = " + zip_filename) 21 # 作成した名前と同じZIPファイルが存在しなければwhileブロックを抜ける 22 if not os.path.exists(zip_filename): 23 break 24 # ファイルが存在していれば連番を1つ増やして次のループへ進む 25 number = number + 1 26 27 # ②ZIPファイルを作成する部分 28 # ZIPファイルの作成を通知 29 print('Creating %s...' % (zip_filename)) 30 # ファイル名を指定してZIPファイルを書き換えモードで開く 31 backup_zip = zipfile.ZipFile(zip_filename, 'w') 32 33 # フォルダのツリーを巡回してファイルを圧縮する 34 for foldername, subfolders, filenames in os.walk(folder): 35 # 追加するファイル名を出力 36 print('ZIPファイルに{}を追加します...'.format(foldername)) 37 # 現在のフォルダーをZIPファイルに追加する 38 backup_zip.write(foldername) 39 # 現在のフォルダーのファイル名のリストをループ処理 40 for filename in filenames: 41 # folderのベースパスに_を連結 42 new_base = os.path.basename(folder) + '_' 43 # ベースパス_で始まり、.zipで終わるファイル、 44 # 既存のバックアップ用ZIPファイルはスキップする 45 if filename.startswith(new_base) and filename.endswith('.zip'): 46 continue # 次のforループに戻る 47 # バックアップ用ZIPファイル以外は新規に作成したZIPファイルに追加する 48 backup_zip.write(os.path.join(foldername, filename)) 49 # ZIPファイルをクローズ 50 backup_zip.close() 51 print('バックアップ完了') 52 53# プログラムの実行ブロック 54if __name__ == '__main__': 55 # バックアップするフォルダーのパスを指定 56 backup_folder = 'C:\mydata' 57 # ZIPファイルへのバックアップ開始 58 save_zip(backup_folder) 59 # キー入力まで待機 60 input('終了するには何かキーを押してください。')

試したこと

文字コードが原因かと思い、ネットでみかけた情報を若干反映させてみましたが解決できませんでした。

また、一度一括して圧縮する方法も試してみたのですが、結局はこちらの方法でも結局日本語フォルダについてのみ文字化けする同じような状態が発生し、やはり解決方法についてわかりかねている状態です。

import os, zipfile
with zipfile.ZipFile('test.zip','w') as myzip:
for folder, subfolders, files in os.walk('C:\mydata'):
myzip.write(folder)
for file in files:
myzip.write(os.path.join(folder,file))

補足情報(FW/ツールのバージョンなど)

Win7

import sys
sys.version_info

sys.version_info(major=3, minor=7, micro=0, releaselevel='final', serial=0)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

can110

2018/11/02 09:30

解凍手順(ソフト名など)を記載ください。こちらでは正常に圧縮・解凍できてます
yuuta123

2018/11/02 09:43

ありがとうございます。 Lhaplus for Windows Version 1.74 で解凍しました。
tiitoi

2018/11/02 09:46

記載のコードを実行しましたが、Windows10/Python3.6/解凍ソフト 7zip でこちらでも文字化けせず解凍できました。圧縮解凍ソフトの問題等ではないですか?
yuuta123

2018/11/02 09:48

7-Zip 18.05(2018-04-30) for Windows をインストールして、これで解凍してみたら文字化けがおこらず、解消しました。 ありがとうございます。 となると、これはPythonのコードの方はとくに問題なく、単純に解凍の仕方がまずかった、ということでしょうか? もしもこの点さらにおわかりになるようでしたら、お教えいただけましたらありがたいです。 いずれにしてもまずはありがとうございます。
tiitoi

2018/11/02 09:49

文字化けした際はなんの解凍ソフトを使っていたのでしょうか?
can110

2018/11/02 09:50

「単純に解凍の仕方がまずかった、ということでしょうか?」はい。そう考えられます。
yuuta123

2018/11/02 09:54

can110さん、tiitoiさん、ありがとうございました。 解凍の問題だったということで了解しました。 大変助かりました。 tiitoiさん、 Lhaplus for Windows Version 1.74 で解凍しました。
guest

回答1

0

自己解決

Pythonのコードの問題ではなく、解凍の段階での問題だったようで
Lhaplus for Windows Version 1.74
を使って解凍していたのを
7-Zip 18.05(2018-04-30) for Windows
に変えたら解決しました。

ご教示くださった方々、ありがとうございました。

投稿2018/11/02 09:56

yuuta123

総合スコア10

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

katsuko

2018/11/02 15:27

「解凍の段階での問題」というよりかは、zipフォーマットの問題だと思います。 zipフォーマットのアーカイブ内のファイル名の文字コードは、特に決まりはありません。 これは、pythonのマニュアルにも書かれています。 https://docs.python.org/ja/3/library/zipfile.html#zipfile.ZipFile.write まぁ、DOSの頃から存在しているフォーマットなんで、仕方ありませんね…。 というわけで、圧縮するソフトと解凍するソフトが違えば起きうる問題だと思ってください。
yuuta123

2018/11/05 03:09

追加ご指摘ありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問