當前位置:首頁 > 科技文檔 > 硬件 > 正文

GNNSched:面向GPU的圖神經(jīng)網(wǎng)絡推理任務調(diào)度框架

計算機工程與科學 頁數(shù): 11 2024-01-15
摘要: 由于頻繁的顯存訪問,圖神經(jīng)網(wǎng)絡GNN在GPU上運行時往往資源利用率較低?,F(xiàn)有的推理框架由于沒有考慮GNN輸入的不規(guī)則性,直接適用到GNN進行推理任務共置時可能會超出顯存容量導致任務失敗。對于GNN推理任務,需要根據(jù)其輸入特點預先分析并發(fā)任務的顯存占用情況,以確保并發(fā)任務在GPU上的成功共置。此外,多租戶場景提交的推理任務亟需靈活的調(diào)度策略,以滿足并發(fā)推理任務的服務質量要求。為了... (共11頁)

開通會員,享受整站包年服務立即開通 >