質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Windows 10

Windows 10は、マイクロソフト社がリリースしたOSです。Modern UIを標準画面にした8.1から、10では再びデスクトップ主体に戻され、UIも変更されています。PCやスマホ、タブレットなど様々なデバイスに幅広く対応していることが特徴です。

Q&A

解決済

1回答

1023閲覧

Windows10でダウンロードしたファイル全体を解凍することなく中身を閲覧したい

giro1975

総合スコア37

Windows 10

Windows 10は、マイクロソフト社がリリースしたOSです。Modern UIを標準画面にした8.1から、10では再びデスクトップ主体に戻され、UIも変更されています。PCやスマホ、タブレットなど様々なデバイスに幅広く対応していることが特徴です。

0グッド

0クリップ

投稿2018/09/22 14:37

環境
Windows10
コマンドプロンプト

Wikipediaからデータセットを次のコマンドで落としました。

wget https://dumps.wikimedia.org/jawiki/latest/jawiki-latest-pages-articles1.xml-p1p106175.bz2

Linuxだと

bzcat jawiki-latest-pages-articles1.xml-p1p106175.bz2 | less

とbzcatコマンドとlessコマンドで、ダウンロードしたファイル全体を解凍することなく中身をできるそうです。Windows10にもこのようなコマンドがあれば教えてください。

よろしくお願いします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

そもそもWindowsにはbzip2を解凍するツールがデフォルトではありません。ですので、何かしらのツールを入れる必要があります。

Linux環境または擬似UNIX/Linux環境

Linuxと同じbzcatlessが出来る環境が用意できれば同じように出来ます。候補としては次の5つです。

  • MSYS2 ... 擬似的なUNIX/Linux環境です。Linuxにあるようなほとんどのソフトウェアをパッケージとしてインストールできます。各コマンドはWindowsに合わせてビルドされているため、MSYS2上ではなくも単独で使用できます。
  • Git for Windows ... 最低限のMSYS2環境が付いてきます。パッケージは追加できませんが、MSYS2を入れるよりはお手軽です。
  • Cygwin ... 擬似的なUNIX/Linux環境です。MSYS2との違いはUNIX/Linuxの動作をエミュレートしていることです。ですのでMSYS2よりも動作がUNIX/Linuxに近いですが、エミュレートを行うcygwin1.dllが必要になります。
  • Windows Subsystem for Linux
    Windows上でLinuxをシームレスに動作させる仕組みです。仮想と言うよりコンテナに近い仕組みになっています。Linux自体はMicrosoft Storeから好きなディストビューションをダウンロードします。LinuxのコマンドはWSL上またはWSL経由でしか動作できません。
  • 仮想環境 ... Virtual Boxであれば仮想環境のLinuxからWindows上のディレクトリをマウントできます。VagrantとSSHを使えば、コマンドプロンプトのみで完結させることも可能です。

7-Zipのコマンドライン版

7-Zipはbzip2の解凍に対応しているだけではなく、コマンドライン版があります。このコマンドライン版では標準出力に出す事が可能です。7-Zipをインストールして、PATHを通していれば、次のようにして閲覧できます。

7z x jawiki-latest-pages-articles1.xml-p1p106175.bz2 -so | more

Windowsには標準でlessがありませんので、moreを使ってください。

投稿2018/09/22 21:24

編集2018/09/23 01:47
raccy

総合スコア21733

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

raccy

2018/09/23 01:48

「WSL経由」を追記しておきました。
giro1975

2018/09/23 06:43

raccy 様 お世話になります。WslでUbuntuを使っています。コマンドプロンプトで一元管理した方が楽だと思い、コマンドプロンプトでのやり方がベストです。なかったらWslで挑戦しようと思っていました。 さっそく7-Zipで挑戦しました。 7z x jawiki-latest-pages-articles1.xml-p1p106175.bz2 -so | more を試しました。 'more' は、内部コマンドまたは外部コマンド、操作可能なプログラムまたはバッチ ファイルとして認識されていません。 とエラーメッセージが出てきます。 7z x jawiki-latest-pages-articles1.xml-p1p106175.bz2 -so とmoreコマンドを外すと実行できます。 -so と | more の意味を教えてください。 またこれは別に質問した方が良いのかもしれません。 7z x jawiki-latest-pages-articles1.xml-p1p106175.bz2 -so を実行すると文字化けがひどいです。解決する方法、原因がわかれば教えてください。よろしくお願いします。 <page> <title>雜頑匱蜊・枚</title> <ns>0</ns> <id>755</id> <redirect title="繝励Ο繧ク繧ァ繧ッ繝・貍ォ逕サ螳カ/譌・譛ャ縺ョ貍ォ逕サ螳カ 縺り。・ /> <revision> <id>34308752</id> <parentid>27932924</parentid> <timestamp>2010-10-03T18:58:01Z</timestamp> <contributor> <username>EmausBot</username> <id>397108</id> </contributor> <minor /> <comment>繝ュ繝懊ャ繝医↓繧医k: 莠碁㍾繝ェ繝€繧、繝ャ繧ッ繝井ソョ豁」 竊・[[繝励Ο繧ク繧ァ繧ッ繝・貍ォ逕サ螳カ/譌・譛ャ縺ョ貍ォ逕サ 螳カ 縺り。・.E8.B6.8A.E6.99.BA.E5.8D.83.E6.96.87]]</comment> <model>wikitext</model> <format>text/x-wiki</format> <text xml:space="preserve">#霆「騾・[[繝励Ο繧ク繧ァ繧ッ繝・貍ォ逕サ螳カ/譌・譛ャ縺ョ貍ォ逕サ螳カ 縺り。・.E8.B6.8A.E6.99.BA.E5.8D.83.E6.96.87]]</text> <sha1>ao6vu67klxtyvqxw82446s78q1lq05r</sha1> </revision> </page>
giro1975

2018/09/23 06:47

Takumiboo様 お世話になります。7zで進まない場合はWindows Subsystem for Linuxで実行したいです。ありがとうございます。Windows Subsystem for Linuxは使っているのですが、ファイル管理が手間かなと思い、コマンドプロンプトで一元管理したいと考えていました。
raccy

2018/09/23 07:07

ファイルの文字コードとコンソールの文字コードが一致しない場合は文字化けします。たぶんUTF-8なので、 chcp 65001 とコンソールの文字コードをUTF-8(コードページ65001)に変更してから、実行してください。WSLのコマンドを使うなら wsl bzcat jawiki-latest-pages-articles1.xml-p1p106175.bz2 | wsl less という形で出来ますが、これも同じくUTF-8に変更していないと文字化けします。なお、WSLのコンソールの場合、デフォルトでUTF-8なので、WSL上でそのまま実行する場合は文字化けはしません。 コンソールをデフォルトのCP932(別名Windows-31J、Shfit_JISの亜種)のまま文字化けを防ぎたい場合は間にnkf等での変換を加える必要があります。ただ、それでも絵文字等は化けてしまうので注意が必要です。
giro1975

2018/09/23 07:42

ありがとうございます。出来ました。いろいろ教えていただき、ありがとうございます。 -so コマンドは 7-zipのコマンドですね。stdoutとか調べてみます。ありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問