一、評測背景
產品創新是制造企業贏得市場競爭的重要手段之一,也是獲得高額利潤的有效方式。過去,中國制造企業的主要依賴產品的后期制造來獲得利潤,但是隨著市場環境的變化,企業逐漸認識到——制造業的競爭實質是產品創新的競爭,擁有自主產品創新能力的企業,才能占領市場優勢地位。在產品創新研發過程中,CAE是企業保證產品質量、減少成本、降低研發周期并快速響應市場的重要技術手段。因此,隨著市場競爭節奏的不斷加快,越來越多的制造企業開始引入CAE技術,并建立仿真分析部門。
另一方面,隨著產品復雜程度的不斷增大,企業仿真分析部門又面臨著新的挑戰。比如隨著復雜產品模型所包含的數據量不斷增加,為了實現對產品在實際工作中的性能表現更為精確的模擬,還需進行多學科仿真,這些仿真計算耗時越來越長,有時甚至需要幾天,嚴重制約了產品研發進程。同時,在CAE軟件環境中進行前后處理時,復雜模型的操作以及結果云圖、動畫的生成對圖形顯示的要求也越來越高,圖形顯示能力直接影響著工程師的操作體驗以及分析結果獲取的準確度。
幸運的是,近年來隨著GPU加速計算的興起,利用GPU來加速CAE分析已經成為一種趨勢。GPU強大的并行計算能力能有效地對圖形計算和仿真分析過程的大規模數據進行并行浮點處理,大幅加速產品的虛擬仿真分析過程,從而有效的縮短產品的研發周期。從成本上講,CPU+GPU的搭配模式,不斷能有效的減少企業購買的軟件許可證費用,還可以降低企業在工作站購買上的硬件投入成本。
二、測試平臺
為了更好的讓企業了解GPU加速給CAE分析過程帶來的性能提升,e-works特別安排了一次針對麗臺Quadro K6000專業顯卡的性能評測,而本次選用的平臺為麗臺最新推出的Maximus工作站。平臺的詳細配置如下:
表1 測試平臺配置
Quadro K6000是麗臺科技2013年最新發布的頂級專業級工作站顯卡,該顯卡擁有2880個流處理器、240個紋理處理單元和48個ROP單元,單精度浮點性能為5.2TFlops,雙精度浮點計算能力大約為1.7TFlops,也是目前超高端專業顯卡市場計算性能最強大的顯卡之一。同時,本次測試搭配的Maximus工作站也是麗臺公司針對制造企業的高性能研發計算領域主推的平臺,Maximus工作站可以同時搭配Tesla高性能圖形計算卡和Quadro高性能專業顯卡,實現設計和仿真應用的一體化,也目前市場上唯一一款集產品的設計、仿真分析于一體的工作站平臺,其最重要的價值是能實現設計與仿真計算的并行,從而大幅提升制造企業的產品研發效率。
圖1 麗臺Quadro K6000專業顯卡
圖2 麗臺Maximus工作站
圖3 winFast WS2000工作站規格
三、測試軟件介紹
Abaqus是一套功能強大的工程模擬的有限元軟件,其解決問題的范圍從相對簡單的線性分析到許多復雜的非線性問題。作為通用的模擬工具,除了能解決大量結構問題,Abaqus還可以模擬其他工程領域的許多問題,例如熱傳導、質量擴散、熱電耦合分析、聲學分析、巖土力學分析及壓電介質分析。由于Abaqus優秀的分析能力和模擬復雜系統的可靠性使得它在各國的工業和研究中得到廣泛的使用,在大量的高科技產品研究中也發揮著巨大的作用。Abaqus軟件從6.11版本開始可以支持NVIDIA的GPU加速技術,本次評測使用的是最新的Abaqus 6.13版本。
圖4 ABAQUS/CAE 6.13
四、性能測試
本次評測即在Abaqus環境下,測試麗臺Quadro K6000通過GPU技術對CAE工作中圖形顯示增強和計算加速的效果。
1.評測思路
CAE分析主要有三個步驟,即:前處理、有限元求解計算、后處理。前處理中為產品建立合理的有限元分析模型,并進行單元屬性定義、網格劃分和載荷施加;有限元求解計算就是對有限元模型進行單元特性分析并求解的過程;后處理則根據工程或產品設計要求對有限元分析結果進行分析進而論證設計的合理性并優化,以滿足客戶對產品的設計需求。本次評測主要劃分為以下幾個步驟:
1)模型導入后的基本操作
如同其他CAE軟件,Abaqus的建模功能有限,只適合建立簡單部件。為了充分測試在CAE軟件環境下的大模型顯示效果及操作流暢度,本次評測選擇從外部導入復雜模型,并對其進行平移,局部放大縮小,旋轉,剖切,線框切換等基本操作。
2)有限元求解計算
作為整個CAE分析中計算強度最高的部分,有限元求解計算耗時直接影響整個CAE分析周期的長短。本次評測將記錄在CPU數量調用相同時,無GPU加速、有GPU加速、GPU并行加速三種情況下求解計算過程所耗時間,進行對比分析得出GPU加速效果。
3)結果云圖與動畫的生成與顯示
有限元計算完成之后,為了更加清晰直觀的以圖像形式顯示出結果,需要生成應力應變云圖及動畫,復雜模型計算結果云圖及動畫的顯示效果對顯卡要求較高。
4)拼接屏
憑借 DisplayPort 1.2,Quadro K6000單卡可支持四臺同時工作的顯示器和最高 4k 分辨率。通過NVIDIA Mosaic 多顯示器技術,在不犧牲性能或處理能力的情況下,可在一臺工作站上輕松地將所有應用程序的畫面擴展到多臺高分辨率顯示器或投影儀上。
2.CAE測試分析
本次選用的測試模型是一個發動機裝配體,網格劃分節點數:1060943,單元數665799,進行靜力學分析。如圖5所示。
圖5 發動機裝配體
1.模型基本操作
圖6 局部放大
圖7 平移操作
圖8 模轉操作
對模型載入、縮放、旋轉以及編輯操作均比較流暢,基本上都在瞬間完成,這也說明在設計性能上完全能滿足要求。同時,我們發現不論是模型的色彩還是線條都非常之清晰。以前也做過很多專業圖形顯卡及工作站的評測,但很少看到模型色彩有著如此良好的光澤度。對設計工程師而言,色彩真實且操作流暢的設計平臺能大大的提升使用體驗和效率。
2.有限元分析
前處理完成后即開始進行有限元分析計算求解,這也是整個CAE分析過程中最耗費時間的環節,計算時間過長甚至嚴重拖慢整個產品開發流程。對此,借助近些年興起的高性能計算技術,從硬件和軟件兩方面支持并行計算,可以大大縮短CAE計算求解時間。
以前的CAE應用評測中,都是對比調用不同核數情況下的求解耗時,得出多核調用對計算效率提高的水平。而近些年興起的GPU技術除了提升顯卡性能之外,也能通過其強大的運算能力,大大縮短計算時間,這種加速能力在對圖形顯示處理水平要求很高的CAE分析工作中則顯得更為重要。因此本次評測一個很重要的目的就是測試GPU加速技術對CAE分析求解計算的加速水平如何。
本次測試平臺搭配了2顆6核心12線程的處理器,因此共有12核心24線程可進行計算調用。另外,由于搭配了麗臺Quadro K6000專業顯卡,我們也通過將GPU的計算能力融入到分析中來感受計算性能的提升。表2為發動機裝配體靜載荷求解計算的耗時數據。
表2 有限元分析測試數據(單位:秒)
對于表2中的數據,我們可以主要關注前面三項,UseTime為模型的實際計算時間,System Time是指計算過程中的時間損耗(花費在傳輸以及指令流分配等過程的時間),Total CPU Time為整個CPU計算耗時,為User Time與System Time時間之和。對比表2數據,我們可以很清楚的發現在調用GPU和不調用GPU的場景中的計算時間有著非常大的區別。比如在2CPU場景中,調用GPU時,CPU總耗時長為2012.1秒,而不調用GPU時,CPU總耗時長為4860.3秒,GPU的加入將CPU的計算時長縮短了近60%。而這種時長的縮短在4CPU、8CPU、16CPU和24CPU場景中分別為:54%、38%、51%和51%,換言之,GPU計算能力的加入使得整機的圖形計算性能提升了超過1倍。
圖9 計算耗時對比(User Time)
圖10 總計耗時對比(Total Time)
圖9和圖10為調用GPU和未調用GPU性能場景下的耗時對比。我們從數據中可以得出結論,即圖形計算過程中并非調用了CPU核心越多,計算速度就越快。因為調用的CPU核心越多,計算資源的分配過程就越復雜,這會降低CPU的計算效率。比如在不調用GPU的情況下,2CPU和4CPU計算所花費的時間為4826秒和4994秒,而隨著核心數量的增多,計算所耗費的時間也越長。因此,在進行大規模圖形數據計算時,用戶必須謹慎對待多核心的調用,在調用多核心進行計算時,盡可能的找到最佳的性能點。這種情況也同樣出現在CPU與GPU之間,調用的CPU核心越多,耗費在CPU與GPU之間的資源分配時間越長,計算時間也就越長。
也有很多用戶會經常問到,GPU為何能擁有如此強大的圖形計算能力?這是因為GPU的出現一開始就是為了緩解CPU的計算壓力,將CPU從圖形計算中解脫出來。因此,GPU在架構設計上就非常適合于對大量圖形數據的處理。GPU的內核設計的是并行架構,適合在短時間內處理大量類似結構的數據,比如圖形計算、生物工程以及科研分析等。近年來,隨著GPU技術的發展,GPU的性能越來越強大,因此出現了像Maximus工作站這樣的集設計與分析與一體的圖形工作站,通過搭配Quadro K6000專業圖形顯卡,大幅提升企業的研發設計效率。
3.結果云圖與動畫的生成與顯示
有限元分析計算完成并得到了位移、應力或其它基本變量之后,就可以對計算結果進行評估。評估通常可以通過CAE軟件可視化模塊或其它后處理軟件在圖形環境下交互式進行。為了更為直觀清晰呈現出計算結果,可視化模塊可以讀入計算結果文件病以多種方法顯示結果,包括彩色等值線圖、云圖、動畫等。
本環節直接在Abaqus圖形界面環境中打開之前有限元分析步驟中生成的輸出文件(后綴名.odb),然后利用Abaqus中的Visualization功能模塊來生成結果云圖和動畫。
圖11 發動機裝配體靜載荷分析U2應變云圖1
圖12 發動機裝配體靜載荷分析U2應變云圖2
圖13 發動機裝配體靜載荷分析U3應變云圖1
圖14 發動機裝配體靜載荷分析U3應變云圖2
在評測中,圖形展示清晰度高,能滿足工程師對計算結果進行準確評估的要求,而且在對結果云圖展示模式下的模型進行旋轉平移、放大縮小等操作時,也不存在停滯感。隨后對整個應變過程進行動畫生成,動畫畫面清晰、播放過程中應變等值線變化流暢,能夠很好的反映出整個過程。從動畫中截取了四張圖進行觀察,等值輪廓線非常清晰,可以準確的反應出應變結果。
圖15 應變過程動畫截圖1
圖16 應變過程動畫截圖2
圖17 應變過程動畫截圖3
圖18 應變過程動畫截圖4
4.拼接屏
Quadro K6000單卡可支持四臺同時工作的顯示器,通過NVIDIA Mosaic 多顯示器技術,在不犧牲性能或處理能力的情況下,可在一臺工作站上輕松地將所有應用程序的畫面擴展到多臺高分辨率顯示器或投影儀上。評測采用4臺1080P高清顯示器,2 x 2布局,實現單卡4屏拼接總分辨率3840 x 2160 @ 60Hz。
圖19 mosaic拼接屏設置
圖20 4臺高畫質顯示屏拼接
五、總結
本次重點在于測試Quadro K6000工作站顯卡在CAE平臺上的性能,通過對發動機裝配體進行有限元分析、云圖生成以及拼接屏等操作來感受Quadro K6000工作站顯卡給工程師設計與分析帶來的性能提升。測試中我們首先對發動機模型進行了載入、旋轉和修改操作,過程非常之流暢,感覺不到任何因性能不足而導致的拖影或卡屏的現象。在有限元分析過程中,我們通過對比在調用GPU和不調用GPU環境下的計算與分析耗時,測試過程充分證明了GPU能大幅加速模型的分析過程,測試結果顯示,在調用GPU進行分析時,計算耗時能至少減少一半以上。對企業而言,產品設計與分析時間的縮短能減少產品的設計周期,從而提升企業的市場競爭力。最后我們還進行了云圖生成及拼接屏的性能測試,云圖生成主要是為了將有限元分析結果以圖象或動畫的形式來展現出來,使得測試的效果更佳清晰。因此對圖形顯示性能要求較高。從測試結果看,云圖生成過程非常順利,而且在很短時間內就完成,生成的圖像及動畫質量也非常好,這充分顯示了Quadro K6000工作站顯卡的強大性能。同時,我們也深刻感受到了Maximus工作站穩定的性能。
在以往的測試中,e-works評測人員基本上選用的都是較為常用的圖形工作站,但Maximus工作站與這些產品有所不同。在設計上,Maximus工作站有著更長的機箱,更強大的電源系統和風扇。在功能上,Maximus工作站能同時搭配Quadro工作站顯卡和Tesla高性能計算卡,并能根據計算數據類型來自動選擇Quadro或Tesla。這使得Maximus工作站不但能做基本的CAD圖形設計,而且還能進行CAE仿真分析,滿足企業大規模圖形數據計算的需求。
總體來說,制造企業要提升市場競爭力,就必須設計市場需求的產品,更好、更快的根據市場需求開發用戶需要的產品是考驗企業市場生存能力的關鍵。因此,擁有一款好的開發和設計平臺至關重要。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://m.guhuozai8.cn/
本文標題:麗臺Quadro K6000工作站顯卡CAE性能評測報告
本文網址:http://m.guhuozai8.cn/html/consultation/10839612273.html