質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
C#

C#はマルチパラダイムプログラミング言語の1つで、命令形・宣言型・関数型・ジェネリック型・コンポーネント指向・オブジェクティブ指向のプログラミング開発すべてに対応しています。

Q&A

解決済

1回答

8146閲覧

Zip,RARなどを文字化けなく解凍したい

退会済みユーザー

退会済みユーザー

総合スコア0

C#

C#はマルチパラダイムプログラミング言語の1つで、命令形・宣言型・関数型・ジェネリック型・コンポーネント指向・オブジェクティブ指向のプログラミング開発すべてに対応しています。

0グッド

2クリップ

投稿2015/09/16 15:08

編集2015/09/17 02:13

Zip/RARを解凍して使用したいと考えています。
現在SharpCompressというライブラリを見つけ、解凍したのですが日本語パス名が文字化けしてしまいます。
この文字化けを回避したいのですが方法が判りません。
このライブラリでなく、別のものでも構いません。
判る方居ましたらご教示お願いします。

やりたいこと
・Zip/RARを解凍したい
・直接ファイル展開ではなくStream、あるいはByteでメモリ上に欲しい
・出来る限り多くのアーカイブに対応している方が良い(必須ではない)

調べたこと
・System.Text.Encodingを使用して文字コード変換をしてみた(ASCII、UNICODE、Shift_JIS)
→一通り変換を試したがどれも正常に変換されず。
・文字コードをバイト配列で調査してみた。
→自分が眺めた限りフォーマットがわからなかった。
・日本語のアーカイブはShift_JISで格納するらしい(Windows)

恐らくアーカイブ内部のバイトデータを何らかの形でstringにしてしまっているのが問題ではないかという推測しています。

以上、よろしくお願いします。

取得時のコードを書きました。

C#

1private void GetName() 2{ 3 using (var readStream = new FileStream("読み込むアーカイブ名.zip", FileMode.Open, FileAccess.Read)) 4 using (var stream = Stream.Synchronized(readStream)) 5 { 6 using (var r = ArchiveFactory.Open(stream)) 7 { 8 foreach(var entry in r.Entries) 9 { 10 string name = entry.Key; //文字化けするコード 11 string name2 = convert(entry.Key); //文字化け対策コード 12 } 13 } 14 } 15} 16private static string convert(string text) 17{ 18 var source = Encoding.ASCII; //暫定的に対象をASCIIに 19 var destination = Encoding.GetEncoding("Shift_JIS"); 20 21 var bytes = source.GetBytes(text); 22 var sjisBytes = Encoding.Convert(source, destination, bytes); 23 return destination.GetString(sjisBytes); 24}

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

pi-chan

2015/09/16 22:29

恐らく「System.Text.Encodingを使用して文字コード変換」はファイルの内容に関するものなので、「日本語パス名が文字化け」対策には別の対応が必要なのだと思います。 問題となっている部分のソースを貼り付けることはできますか?
退会済みユーザー

退会済みユーザー

2015/09/17 02:15

返信有り難うございます。 ソースコードを追加しました。
yuba

2015/09/17 03:26

眺めてみたがエンコーディングがわからなかったというそのバイト列、出すわけにいきませんか?
退会済みユーザー

退会済みユーザー

2015/09/17 04:54

返信有り難うございます。 知り合いの方にテストを頼んでいたので対象のアーカイブは現在持っていないのです。 ファイルを送ってもらい次第、抽出してみます。
guest

回答1

0

ベストアンサー

C#に関しては、私は全くの素人なので、どこをどのように修正すべきかをズバリとご指摘できないのが残念ですが…

アーカイブされている個々のファイル(各エントリー)の内容については、どのような文字コードでエンコードされているかは関係ない(むしろ勝手に変更してはいけない)です。
一方、アーカイブ内の各エントリーのパス(ディレクトリ+ファイル名)の部分については、適宜文字エンコードを変更する必要があります。

そして、これを実現するためには、以下の3点を知る必要があります。
0. アーカイブされる前のファイルシステム上ではどのような文字コードで表現されていたのか
0. これから解凍する先のファイルシステム上ではどのような文字コードで表現される予定なのか
0. 入力ストリームのうち、各エントリーのパス部分をどのように扱えば良いか

解凍対象のアーカイブ(読み込むアーカイブ名.zip)を直に解析(上記の 1.)できれば一番良いですが、どのような環境でアーカイブされたかが分かれば推測できますし、バリエーションとしてはそれほど多くないので、必須ではありません。

ちなみに、いま Zip/RAR を解凍する先の環境(上記の 2.)はWindows(Shift_JIS)でしょうか?

一番重要なことは、入力ストリームのうち、各エントリーのパス部分のみを選択的にエンコーディンする方法(上記の 3.)ですが、こちら の情報が参考になると思います。
→ 特に「The entry name encoding/decoding problem」の箇所

# Zipの場合、ZipArchiveEntry.class を使用して、各エントリーのパスや内容を個別に扱えるようです。

以上、ご参考になれば幸いです。

投稿2015/09/17 20:04

pi-chan

総合スコア5936

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2015/09/18 01:28

回答ありがとうございます。 紹介いただいた記事を元にSharpCompressのソースを調べたらArchiveEncodingなるものを見つけました。 staticクラスだったのでプロパティを設定してあげると無事文字化けが解消されました。 SharpCompress.Common.ArchiveEncoding.Default = System.Text.Encoding.Default; ありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問