背景
HTTP REST APIを利用して、HDFSから特定のディレクトリ配下のすべてのファイルを取得したいと考えています。
curlコマンドにてファイルを取得できることはわかりましたが、ディレクトリの取得はできないことが分かりました。
作りこみをすれば取得できるとの記事がありましたが、具体的にどのように作りこみをすればよいかイメージが湧きません。
実現したいこと
HDFSからディレクトリ配下のすべてのファイルを取得したい
質問
処理としては以下のような処理で実現できるのでしょうか。
1、curlコマンドにてディレクトリリストを取得
2 ディレクトリリストをもとに1ディレクトリ単位に配下のファイルリストを取得
3 ファイルリストをもとに1ファイル単位にcurlコマンドにてファイル取得
この場合、かなり複雑な処理なるのではないかと思っています。
別の手段があればそちらで実現したいと思っています。
前提条件
curlコマンドを実行するサーバは、HDFSとは別のLinuxサーバになります。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。