解決方案

以客戶為中心,提供定制化或一站式的全棧解決方案,賦能千行百業

寶德GPU高性能計算解決方案
項目背景

GPU計算是指利用圖形卡來進行一般意義上的計算,而不是傳統意義上的圖形繪制。時至今日,GPU已發展成為一種高度并行化、多線程、多核的處理器,具有杰出的計算功率和極高的存儲器帶寬。如圖:

具體地說,GPU專用于解決可表示為數據并行計算的問題——在許多數據元素上并行執行的程序,具有極高的計算密度(數學運算與存儲器運算的比率)。由于所有數據元素都執行相同的程序,因此對精密流控制的要求不高;由于在許多數據元素上運行,且具有較高的計算密度,因而可通過計算隱藏存儲器訪問延遲,而不必使用較大的數據緩存。

數據并行處理會將數據元素映射到并行處理線程。許多處理大型數據集的應用程序都可使用數據并行編程模型來加速計算。在 3D渲染中,大量的像素和頂點集將映射到并行線程。類似地,圖像和媒體處理應用程序(如渲染圖像的后期處理、視頻編碼和解碼、圖像縮放、立體視覺和模式識別等)可將圖像塊和像素映射到并行處理線程。實際上,在圖像渲染和處理領域之外的許多算法也都是通過數據并行處理加速的——從普通信號處理或物理仿真一直到數理金融或數理生物學。在上述領域,GPU計算已經獲得了成功的應用,并取得了令人難以置信的加速效果。

方案介紹

整套GPU高性能方案采用通用CPU和專用GPU均衡設計,既保證了GPU的處理性能,又兼顧了通用CPU的計算能力。既保證了適合GPU的高并行度計算應用的需求,同時也保證了非高并行度應用和尚未進行GPU移植的應用需求。并且由于GPU具有較高浮點計算性能的特點,方案中使用GPU作為主體計算資源,將圖形處理器引入到高性能計算領域。

方案解析

GPU計算節點使用了寶德PR4910P,該機型有著超高的擴展性,GPU方面最多支持到10個全高全長的GPU插槽。同時支持多種的網絡支持,可實現增強的高速性能和 I/O 靈活性,滿足不同應用程序的互聯需。

存儲節點采用了寶德PR4036P4機型,具有高可擴充性和高可用性,能夠解決數據爆炸性增長帶來的存儲挑戰,并且支持智能陣列,顯著增強I/O性能和數據的安全性。

在網絡通信方面所有節點通過高速的Infiniband網絡連接,實現節點之間的全互聯,大大降低節點之間的通信延遲,為集群提供了一個高帶寬低延遲的IO和網絡數據交換性能環境。

方案優勢
  • 高計算性能

    系統支持CPU和GPU的混合計算。系統具有較高的計算密度,可在實現超過500TFlops(單精度)的計算能力,同時具有良好的可擴展性,能夠輕松擴展到千萬億次。

  • 高可擴展性

    GPU節點、存儲節點、計算節點等有很高的擴展性,既能滿足現階段的業務要求,也能更具未來業務量的增長進行升級和擴容。

  • 高穩定性

    寶德通過統一的集群管理、作業調度,結合寶德高性能的服務器,從各個方面提高整套系統的穩定性,大大提高用戶的使用穩定性同時減少了故障率。

  • 服務超越

    行業多年經驗的HPC專家可為用戶提供應用級別的運維服務,協助用戶應用調優,發現問題,提供專業的解決方案。

国产免费破外女真实出血视频