「ストリーミングの仕組み」というと、かなり漠然で広い範囲に該当する質問かと思います。
素人考えでも、下記みたいにいろんな分野に分解できると思うのですが
+ストリーミングの仕組み
+ 音楽データを格納する方法(ストレージ)
-GCP、AWS、独自サーバ・・・
+ストレージから音楽データを届ける方法(ネットワーク)
-負荷分散、HLS、RTP・・・
+届けられたデータを各端末で再生する技術
-iOS、Windows、Android各プラットフォームのAPI・・・
これらを横断的に説明するのは難しいかと思います。
運よくteratailにそういった技術に精通した方がいらっしゃれば回答をくれるかもしれませんが・・・。
興味の赴くままに各個撃破で検索すると
HTTP Live Streaming, HLSのまとめ 概要・仕組み・課題など
GCP と音楽業界 – Spotify と Shazam に見る GCP の活用事例
技術者の思い込み裏切る「Clubhouse」 枯れた技術を水平思考
などたくさんあります。
仕組みについての疑問は、上記のような記事を自分で調べてみて、自分である程度模索するしかないのではないかと。
質問者さんのとっかかりは、質問文全体から読み解くに「音楽ストリーミングサーバ~アプリまでを自作したい」、ということのようなので
たとえば下記のような記事:
ストリーミングサーバを自前で自作する
https://szkhaven.com/2020/04/26/hsl_server_mirror_stream01/
や、技術本を参考に自分でアプリを作られてみて、
具体的なコードレベルで疑問にぶつかったときにteratailに質問された方が、具体的な回答を得やすいのではないかと思います。
あとは、サーバの自作までこだわらないのであれば、Spotify API等を活用して、データの取得・加工部分だけ自分で作り込む、とかでしょうか。
いずれにしてもteratailへの質問は具体的なものを作り始めてからを推奨します。