Kubeflow異構(gòu)算力調(diào)度策略研究
計(jì)算機(jī)工程
頁數(shù): 8 2023-07-13
摘要: Kubeflow將機(jī)器學(xué)習(xí)和云計(jì)算技術(shù)兩個(gè)技術(shù)領(lǐng)域相結(jié)合,集成了大量的機(jī)器學(xué)習(xí)工具,為生產(chǎn)級(jí)的機(jī)器學(xué)習(xí)平臺(tái)落地提供了可行方案。機(jī)器學(xué)習(xí)通常依托圖形處理器(GPU)等專用處理器來提高訓(xùn)練和推理速度,隨著云計(jì)算集群規(guī)模的動(dòng)態(tài)調(diào)整,不同計(jì)算架構(gòu)的云計(jì)算節(jié)點(diǎn)可以靈活地加入/退出集群,傳統(tǒng)的輪詢調(diào)度策略已無法滿足動(dòng)態(tài)調(diào)整下的異構(gòu)算力資源調(diào)度。為解決Kubeflow平臺(tái)異構(gòu)算力的分配優(yōu)化問... (共8頁)