機械学習、インフラ共に初学者です。
私が在学している学校の研究室では4台の計算機サーバ(各TitanX1枚)が稼働しています。
現在は、サーバを使いたい人が申し出て一人に対し一つのサーバが割り当てられるというような状況で、計算資源がかなり無駄になってしまっています。
そこで、ジョブ(機械学習のタスクなど)を投げる用のサーバを立ててそこから各計算機サーバに分散させるというような技術を探しています。
もしそういったサービスやシステムなどがあればお教えいただきたいです。
よろしくお願いします m(__)m
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。