Amazon S3
データレイクの構築には、構造化データ・非構造化データ・半構造化データのいずれも格納できるオブジェクトストレージが適しています。S3はオブジェクトストレージなので、データレイクのストレージとしてよく利用されます。ただし、S3はストレージでしかないので、ETLやデータ分析も行うなら他のサービスも必要になります。
したがって「S3 = データレイク」ではなく、「データレイク構築に適したストレージ」の方が表現として正しいかと思います。
尚、データレイクに特化したAWS Lake Formationというサービスもあります。
Box
Dropbox
OneDrive
これらにオブジェクトを格納することはできると思いますが、ストレージだけ用意してもデータレイクとしてビジネスニーズを満たせるわけではないので、ストレージとのシステム連携を考慮するとデータレイクとして利用するのは難しいと思います。(私が知らないだけで事例があれば申し訳ありません)
企業内のファイルサーバ
ファイルストレージは拡張性に乏しく、データレイクには不向きかと思います。
お勧めの書籍を紹介しておきます。データレイクのストレージに求められる役割についても、わかりやすく説明されていました。
Amazon.co.jp: AWSではじめるデータレイク: クラウドによる統合型データリポジトリ構築入門 : 上原 誠, 志村 誠, 下佐粉 昭, 関山 宜孝: 本
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。