導語:CXL是一種開放式全新互聯技術標準,可在主機處理器與加速器、內存緩沖區、智能I/O設備等設備之間提供高帶寬、低延遲連接,從而滿足高性能異構計算的要求,并且其維護CPU/GPU內存空間和連接設備內存之間的一致性,突破內存墻瓶頸,縮減整體響應時間。此外,CXL支持部署新的內存層,可以彌合主內存和SSD存儲之間的延遲差距。
隨著AI應用爆發,“內存墻”成為制約計算系統性能的主要因素之一。CXL建立在PCIe的物理和電氣接口之上,CXL內存擴展功能可在服務器中的直連DIMM插槽之外實現額外的內存容量和帶寬,支持內存池化和共享,滿足高性能CPU/GPU的算力需求。
近日,佰維成功研發并發布了支持CXL 2.0規范的CXL DRAM內存擴展模塊。佰維CXL 2.0 DRAM采用EDSFF(E3.S)外形規格,內存容量高達96GB,同時支持PCIe 5.0×8接口,理論帶寬高達32GB/s,可與支持CXL規范及E3.S接口的背板和服務器主板直連,擴展服務器內存容量和帶寬。同時,佰維可針對無E3.S接口的服務器背板提供CXL AIC轉接卡。
佰維CXL 2.0 DRAM的特點和優勢
- 搭載高性能內存擴展控制器,遵循0 Type3標準,支持PCIe5.0x8接口,理論帶寬高達32GB/s。
- 嚴選優質DDR5內存顆粒,容量高達96GB。
- 支持On-Die ECC、Side-Band ECC、SDDC、SECDED等功能。
- 允許多達16臺主機同時訪問內存的不同部分,支持內存池化共享。
- 同步開源發布CXL DRAM軟件工具包,以確保用戶無障礙部署CXL擴展內存。工具包特點:可提供CXL的顯示,隱式API,客戶可根據不同應用場景進行使用;可提供應用層級的CXL的numa工具使用方法,建立應用層級對CXL的直觀感受。
Latency性能方面,在實際測試中,佰維CXL 2.0 DRAM掛載于node 2節點,與掛載于node 0節點的CPU存取Latency為247.1ns,帶寬超過21GB/s,Latency性能優異,賦能數據高速處理。
Latency測試
Bandwidth測試
人工智能(AI)和機器學習(ML)對高速數據處理的需求持續增長,佰維CXL 2.0 DRAM兼具支持內存容量和帶寬擴展、內存池化共享、高帶寬、低延遲、高可靠性等特點,賦能AI高性能計算。目前,佰維可為客戶和合作伙伴提供32GB~96GB CXL 2.0 DRAM的功能樣機,進行聯合評估和測試。未來,佰維將持續關注CXL技術,賦能高性能計算需求。
延伸:AIC轉接卡
針對無E3.S接口的服務器背板,佰維可提供AIC轉接卡,助力服務器實現CXL RDIMM內存擴展。