Python　ZIPファイル圧縮時に圧縮対象のファイルが展開時文字化けする。

Question

### 実現したいこと
サーバーで圧縮した日本語が含まれるPDFファイルをZIPにまとめ、正常にクライアントが解凍できるようにしたい。

### 発生している問題・分からないこと
PDFファイルをZIPにまとめる際、生成されたZIPファイルを解凍すると中身のPDFファイルの日本語が文字化けする（数字は正常）

### エラーメッセージ
```error
エラーメッセージはありません。
ツールには単体のPDFをダウンロードする機能もあるのですが、単体の方では問題なく日本語になっています。

```

### 該当のソースコード

```Python
def create_zip_with_logs(zip_path, file_paths, log_lines):
    with zipfile.ZipFile(zip_path, 'w', compression=zipfile.ZIP_DEFLATED) as zipf:
        # PDFファイルを追加
        for file_path in file_paths:
            arcname = os.path.basename(file_path)
            print(f"[DEBUG] アーカイブ名: {arcname}")
            
            zip_info = zipfile.ZipInfo(arcname)
            zip_info.compress_type = zipfile.ZIP_DEFLATED
            
            # ファイルのタイムスタンプを設定
            stat = os.stat(file_path)
            zip_info.date_time = datetime.fromtimestamp(stat.st_mtime).timetuple()[:6]
            
            with open(file_path, 'rb') as f:
                zipf.writestr(zip_info, f.read())
```

```
特になし
```

### 試したこと・調べたこと
- [x] teratailやGoogle等で検索した
- [x] ソースコードを自分なりに変更した
- [ ] 知人に聞いた
- [ ] その他

##### 上記の詳細・結果
ChatGPTやClaudeで投げてみても解決しませんでした。
文字コードの設定周りがかわりました。

### 補足
開発環境：Windows
本番環境：Ubuntu
クライアント：Windows　GoogleChrome

文字化け環境
開発環境→Windows　クライアント→Windows

zip_pathには作成したZIPファイルのパス
file_pathsには圧縮予定のファイル（今回はPDF）のパス
が代入されます。

###追加補足
ご回答、コメントの方ありがとうございます。
わかりづらかった部分があるかと思いますので追加で補足させていただきます。
文字化けするのはZipに圧縮したPDFの「ファイル名」です。
念の為圧縮前にprintでファイル名を確認しているのですがそこまではコンソールに日本語でちゃんと表示されます。
圧縮し、WindowsのChrome経由でダウンロードしたら文字化けしてしまう。
という形です。

Answer

現在自分が実装しているシステムでも似たような現象が起きた過去があったので
実際に試してみましたが、やはりzipfileが正しくエンコード処理していないのが原因のようです。

```py
import zipfile

#ファイル名は文字化けする
with zipfile.ZipFile('zip_test.zip') as zipf:
    for zinfo in zipf.infolist():        # ZipInfoオブジェクトを取得
        #if not zinfo.flag_bits & 0x800:  # flag_bitsプロパティで文字コードを取得
            #zinfo.filename = zinfo.filename.encode('cp437').decode('cp932')
        zipf.extract(zinfo, 'unzip')

#ファイル名は文字化けしない
with zipfile.ZipFile('zip_test.zip') as zipf:
    for zinfo in zipf.infolist():        # ZipInfoオブジェクトを取得
        if not zinfo.flag_bits & 0x800:  # flag_bitsプロパティで文字コードを取得
            zinfo.filename = zinfo.filename.encode('cp437').decode('cp932')
        zipf.extract(zinfo, 'unzip')
```

コメントアウトしない状態だと文字化けされてファイル保存され、コメントアウトを外しエンコード処理を施した後ではきちんと日本語ファイル名で表示されます。
色々なページで現象の指摘がありましたが、一例として。
https://www.shibutan-bloomers.com/python_libraly_zip_shutil/1402/

ちなみに、この現象は圧縮でも展開でもzipfileのファイル名生成に関わる部分であるため、同様に起きました。

Answer

はい、この問題はZIPファイル内のファイル名（特に日本語を含む場合）のエンコーディングに関する非常によくある問題です。zipfileモジュールはデフォルトでファイル名にCP437という古い文字コードを使用しようとするため、日本語が文字化けします。 ●●●●

投稿2025/07/17 10:05

Janet729Shires

総合スコア6

実現したいこと

発生している問題・分からないこと

エラーメッセージ

該当のソースコード

試したこと・調べたこと

上記の詳細・結果

補足

関連した質問