質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
ファイル

ファイルとは、文字列に基づいた名前又はパスからアクセスすることができる、任意の情報のブロック又は情報を格納するためのリソースです。

並列処理

複数の計算が同時に実行される手法

ダウンロード

リモートシステムからローカルシステムへとデータを受信する事、もしくはそのようなデータ転送を行う事をダウンロードと呼びます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

zip

ZIPとは、複数のファイルをひとつにまとめて圧縮したり、圧縮したファイルを展開することができるアーカイブフォーマットです。 1998年以降のWindowsOS各バージョンで、標準の圧縮フォルダとして採用されています。 MacOSでも、X v10.3以降に他の圧縮ソフトとまとめてZIP機能を採用しています。

Q&A

解決済

3回答

1548閲覧

巨大なファイルをダウンロードと閲覧する方法について

退会済みユーザー

退会済みユーザー

総合スコア0

ファイル

ファイルとは、文字列に基づいた名前又はパスからアクセスすることができる、任意の情報のブロック又は情報を格納するためのリソースです。

並列処理

複数の計算が同時に実行される手法

ダウンロード

リモートシステムからローカルシステムへとデータを受信する事、もしくはそのようなデータ転送を行う事をダウンロードと呼びます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

zip

ZIPとは、複数のファイルをひとつにまとめて圧縮したり、圧縮したファイルを展開することができるアーカイブフォーマットです。 1998年以降のWindowsOS各バージョンで、標準の圧縮フォルダとして採用されています。 MacOSでも、X v10.3以降に他の圧縮ソフトとまとめてZIP機能を採用しています。

0グッド

1クリップ

投稿2022/01/08 09:00

実現したいこと

160GBほどのzipファイルをダウンロードして中身を見ようとしています。
一部だけでもいいのですが、ファイルの中身を確認する必要があります。

問題

普通に wgetやダウンロードボタンからダウンロードしようとすると、残り時間9時間と表示されて、残り時間も安定せず11時間とかになったりします。

Mac PCで、メモリもPCでは8GBしかないので、大きなファイルをダウンロードできるサービスや、一部だけダウンロードは可能なのでしょうか。

機械学習などで大きなサイズのファイルを扱う方はどのようにされているでしょうか。

試したこと

Linux screenコマンドで、PCを閉じている間も処理を走らせておける可能性があることや、高速にダウンロードできるコマンドがあることはわかりました。

参考記事:Linux screenコマンド使い方

参考記事:curlやwgetの数倍速い 爆速ダウンローダー aria2を使う

aria2では、[ERROR]で以下のように表示され、ダウンロード失敗しました。

$ aria2c -x5 URL cause: Result too large

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

takasima20

2022/01/08 10:56

クライアントは自分のPCとして、サーバー側ってどうなの? ある程度自由に使えたりする?
退会済みユーザー

退会済みユーザー

2022/01/08 12:32

サーバー側は全く他人の環境なので何もできないです。
guest

回答3

0

ベストアンサー

wgetということなので、HTTPでのダウンロードということでしょうか。

サーバ側が対応していればHTTP範囲リクエストでダウンロードは分割して行えます。

HTTP 範囲リクエスト
https://developer.mozilla.org/ja/docs/Web/HTTP/Range_requests

これで少しづつダウンロードするしかないかと思います。
探せば対応したフリーソフトがあるかもしれませんが、
無ければ自作するしかないです。

ファイル自体は不要で中身の一部だけ必要ということであれば、
HTTP 範囲リクエストでZIPファイルのヘッダー情報だけ読み込んで、その上で選択した項目をHTTP 範囲リクエストにより個別にダウンロードすると良いかと思います。
しかし、さらに対応した対応したフリーソフトは無く、自作は大変になるかと思います。

投稿2022/01/08 11:46

naitou

総合スコア141

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

メモリがちょっと心細いようですし、ネットワークへのアクセスはもしかして無線接続だったりするのでしょうか。そうだとすると数百GBといったファイルの「安定した」ダウンロードは困難ですね。また、ダウンローダの多くはいったん一時ファイルとしてダウンロードしたデータを溜めこみ、最後にマージして目的のファイルに再構築するので、ディスク上に目的のファイルサイズの2倍ぐらいの空きがないとダウンロードが途中で終了してしまったりします。

この辺が阻害要因だとすると、PC側にどんなダウンロード用ソフトを入れても作業が大変になるのは避けられないでしょう。「大きなファイルをダウンロードするサービス」を使ったとしても、結局手元の環境の問題は解決できるわけではありません。

どうしてもその貧弱なマシンの上で作業しなければならないとすれば、私なら、ダウンロードは高速ネットに有線直結された高性能マシンにやらせ、落としたものはUSB接続のポータブルHDDを介して当該マシンに持っていくことを考えると思います。

投稿2022/01/08 09:31

KojiDoi

総合スコア13692

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

こんばんわ。

直接の答えではないので恐縮ですが、

そもそもそのようなサイズの大きいファイルをネットワーク越しに扱わなければならない

重要な要件があるのですか?

投稿2022/01/08 09:20

srsnsts

総合スコア508

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問