趨動科技獵戶座OrionX AI算力池化軟件通過軟件定義異構算力,將物理異構算力硬件資源進行池化管理,將應用與物理硬件資源解耦合,實現業務按需調度異構算力資源及跨廠商異構算力資源精細化管理和靈活調度。方案主要應用于人工智能開發、訓練、推理場景下,可實現GPU算力資源利用率的優化提升,已在能源、金融、運營商、互聯網、新能源車企等諸多行業中產生大量的應用案例。
此次趨動科技聯合麒麟軟件,攜手打造基于銀河麒麟操作系統的異構算力池化解決方案,共同探索AI領域新場景。
芯片架構 CPU:兆芯、海光、amd64
整機硬件:中科可控等國產主流服務器
加速芯片:海光DCU、寒武紀MLU、英偉達GPU
操作系統:銀河麒麟高級服務器操作系統V10
基礎軟件:OrionX AI算力池化軟件
應用軟件:不限
結合銀河麒麟高級服務器操作系統V10提供的內生本質安全、云原生支持、自主平臺深入優化、高性能、易管理等特性,產品層面適應算力資源池技術框架,提升了系統的整體管理、運維、支撐能力。
硬件資源與AI應用松耦合,CPU算力與AI算力按需配比;
AI算力資源按需調用,隨需應變;
顯存可擴展、算力可超分;
AI任務根據資源池內算力資源使用情況統一調度;
AI算力資源聲明式申請,資源自動聚合滿足單機單卡,單機多卡及多機多卡不同場景要求;
AI算力資源集中管理;
自定義AI算力監控規則及監控數據可視化;
AI算力數據分析及統計報表。
本方案主要應用于人工智能開發、訓練、推理場景下異構算力資源的優化使用。
案例名稱:某銀行案例
建設內容:通過異構算力資源池化,GPU資源池化,提高GPU資源利用率。實現GPU資源按照按需分配、隨用隨取、動態回收,使GPU資源從緊缺資源變為了彈性資源,資源彈性按需分配、化全局調用、實時釋放、避免占用,有效提升GPU資源的利用率,且對用戶無感知。同時實現英偉達GPU和國產GPU異構下的統一管理和資源合理分配。
方案價值:方案整體實現資源池全棧國產化,可在各類人工智能應用場景提供可靠、穩定、高效的算力資源。
基礎設施層:服務器采用海光提供的通用算力,海光DCU提供強大AI算力。
操作系統層:銀河麒麟高級服務器操作系統V10針對自主海光CPU平臺在內核安全、RAS特性、I/O性能、虛擬化和國產硬件(橋片、網卡、顯卡、AI卡、加速卡等)及驅動支持等方面優化增強。
虛擬化層:趨動科技OrionX將AI算力資源抽象為虛擬資源,實現AI算力資源的軟件定義。