自去年英特爾發(fā)布銳炫顯卡以來,尤其是在進入到今年之后,英特爾加快了銳炫顯卡驅動的更新頻次,進而使得銳炫顯卡在DX9、DX11游戲方面取得了顯著進步。同時在DX12游戲方面,得益于架構優(yōu)勢,銳炫顯卡本身就有著良好的性能支持。
·DX11、DX9游戲體驗大幅提升
根據(jù)英特爾最新披露的數(shù)據(jù)來看,銳炫A750 8GB限量版顯卡在最新驅動加持,以及搭配英特爾13代酷睿i5-13400F處理器的情況下,相對于首發(fā)時的驅動版本,1080P分辨率下DX11游戲性能已經(jīng)足足提升了19%,99%低幀流暢度提升了20%。了解硬件的朋友都知道,僅憑驅動優(yōu)化就取得如此大幅度的提升并不容易,但是英特爾銳炫做到了。
(資料圖)
截至目前為止,英特爾在今年已經(jīng)推出了多達十數(shù)個個大大小小的銳炫顯卡驅動,總計已經(jīng)推出了近30個驅動版本的更新。
今年一季度,英特爾發(fā)布的針對DX9游戲大幅提升的驅動,促使平均性能提升約為43%,與此同時,銳炫A750顯卡降價至249美元,整體性價比大幅提升。
以《CS:GO》、《英雄聯(lián)盟》等游戲為例,在首版驅動3490和一季度發(fā)布的4086驅動之間,DX9游戲體驗的提升是極大的,最高達到了77%,最低也有10%的平均幀率提升,這使得英特爾銳炫顯卡在DX9游戲上的不足得到彌補。
今年二季度,英特爾進一步深入研究了CPU與GPU的平衡問題,通過大量數(shù)據(jù)統(tǒng)計,表明銳炫A750合適搭配的選擇是酷睿i5,隨后提供了大量優(yōu)惠,加速了銳炫的推廣進程。
在新發(fā)售游戲優(yōu)化方面,目前英特爾為57款新游戲提供了Day 0 Gameon的首日優(yōu)化支持,這意味著當一款新的大型游戲發(fā)布時,英特爾需要完成所有的優(yōu)化工作,并準備好所有的驅動,進而為玩家?guī)砀皿w驗。
此外,Intel XeSS技術也在加快拓展游戲支持,目前原生支持XeSS技術的游戲已經(jīng)超過70款??赡芤仓挥杏⑻貭栠@樣擁有強大生態(tài)能力的公司,才能在短短一年不到的時間里達成如此多里程碑的吧。
·CPU與GPU的平衡關系
在一系列優(yōu)化驗證過程中可以看到,英特爾提供的數(shù)據(jù)都是在銳炫A750與英特爾酷睿i5處理器基礎上進行的測試,因為數(shù)據(jù)顯示酷睿i5處理器是銳炫A750的最佳平衡選擇,那么此時就會有一個問題產(chǎn)生:如果使用酷睿i9處理器去做相同測試會發(fā)生什么呢?
從下圖可以看到,對于酷睿i9處理器,最新驅動與初版驅動之間的性能提升在9%到30%之間,雖然也是相當大的提升,但比起酷睿i5最高77%的提升顯然是要稍微遜色一些。
總體來說,酷睿i5平均性能提升在19%~20%,而酷睿i9約為12%,當看到這組數(shù)據(jù)時,是不是有悖于我們慣有的認知呢?性能越強的處理器不是應該提升更明顯嗎?
其實并非如此。當你使用集成顯卡的時候,CPU因為負載更大,所以CPU性能提升往往有著更高的收益比;而當GPU性能足夠強時,很多時候性能受限就轉移到了CPU上,因此驅動程序需要重新架構,以減少每幀所需的CPU工作量,此時CPU的提升收益就完全不如GPU提升收益來的大了。
我們都知道,游戲每一個畫面幀都需要一定的渲染時間,也就是Frametime,幀生成時間。下圖是英特爾官方給出的渲染流程示意圖,簡單來說就是游戲每一幀開始時會執(zhí)行一系列邏輯,隨后進行物理計算,進行命中檢測,將目標移動到新的位置,可能會繪制新的幾何圖形等,之后會進入渲染過程。
在計算完游戲狀態(tài)之后,它會將所有的游戲狀態(tài)傳遞給一個渲染器,然后渲染器將從游戲狀態(tài)轉換為DirectX調用并進行傳遞,之后會執(zhí)行名為Present”的操作,它是一個DX命令,當被調用時,就意味著已經(jīng)將所有圖形信息都發(fā)送給了DirectX,它現(xiàn)在可以渲染一幀,CPU隨之進入等待狀態(tài),等待“Present”返回之后,進入下一個循環(huán),也就是開始等待渲染新的一幀。
·什么是GPU Busy?
為了搞清楚從一幀的“Present”到下一個幀的“Present”之間的時間間隔,也為了搞清楚CPU與GPU之間在這些階段的平衡關系,英特爾引入了一個新的衡量指標:GPU Busy。通過GPU Busy指標,用戶可以了解到GPU使用多少時間進行實際渲染,多少時間是空閑等待狀態(tài)。同時可以了解游戲運行時,CPU與GPU工作是否處于平衡狀態(tài),是彼此之間高效協(xié)同工作,還是互相閑置互扯后腿。
因此,GPU Busy可以幫助玩家更加清晰直觀地了解到自己的CPU與GPU是否匹配,二者時間是否存在一些瓶頸,同時還能夠分析出游戲分辨率、畫質設定是否合適,以便做出更有對策性地調整。
英特爾院士Tom Petersen表示,“GPUBusy會因游戲而異。在設置中,一般來說,在運行更多的GPU密集型活動時,GPU Busy的程度會更高,當較少時,它會更低,并且大多數(shù)情況下可以很容易通過更改分辨率體現(xiàn)出來。”
比如以1080P分辨率、Ultra畫質下的《守望先鋒2》測試為例,銳炫A750顯卡在搭配酷睿i5處理器時,在首發(fā)3490驅動版本下以及在后續(xù)4571版本下,GPU Busy(黃色)與幀生成時間(藍色)之間的狀態(tài)有著非常顯著的差異。
在使用4571驅動時,GPU Busy與幀生成時間幾乎處于完全同步的狀態(tài),這意味著CPU與GPU在絕大部分時間都能夠高效協(xié)同工作,不會出現(xiàn)明顯的空閑等待期,因此在效率上獲得顯著提升。
GPU Busy這項指標也能夠衡量出游戲在不同畫質時的GPU Busy與幀生成時間之間的狀態(tài)。如下面兩張圖所示,在《反恐精英2》這款游戲中,同樣配置、同為4571驅動的情況下,1080P分辨率低畫質和Ultra畫質時的曲線狀態(tài)差異非常明顯。如果作為玩家看到這樣的GPU Busy指標狀態(tài),那么就會明白,這款游戲在當前配置下最合適的畫質設定就是“Ultra”,而非“Low”。
可見,在引入GPU Busy指標之后,如果玩家特別在于CPU與GPU的工作效率,亦或者說想要獲得最佳游戲體驗,就能夠更加針對性地去選擇硬件搭配和游戲設定了。
·通過PresentMon Beta更好地了解GPU Busy
那么我們如何才能夠測量出自己電腦的GPU Busy指標呢?為此,英特爾推出了PresentMon Beta測試工具。它是為終端用戶和媒體提供的工具,可以使GPU Busy與幀生成時間之間的平衡關系變得可視化。它同時兼容N卡和A卡,支持DirectX11、12、OpenGL、Vulkan等API。
如下圖所示,PresentMon提供了全新的疊加視圖功能,在游戲時可以實時監(jiān)測各項性能數(shù)據(jù),如GPU Busy指標、游戲實時幀率、GPU占用率、溫度等信息,還能夠監(jiān)測99%低幀狀態(tài)等。
PresentMon可由用戶進行界面顯示參數(shù)的自定義,調整顯示效果等等,它包含了大約30種不同的參數(shù)可以監(jiān)控,用戶可以將其設置為數(shù)字文本或圖形圖表模式,同時它也支持直方圖,通過不同的UI形式讓用戶更加了解自己電腦游戲時的狀態(tài)。
其實在筆者看來,如果英特爾能夠把PresentMon集成到Arc Control控制面板里會更加方便。但根據(jù)Tom Petersen的介紹來看,PresentMon其實本身也是一個軟件的集合,因此它涵蓋了一些底層SDK,以便為高級別的軟件提供服務。隨著后續(xù)版本更新,Arc Control可能會逐步開始利用PresentMon服務,但目前還無法實現(xiàn)。因此現(xiàn)階段英特爾首先是將可PresentMon的各項功能加以完善,讓它能更加獨立地運行。此外考慮到PresentMon可以兼容N卡、A卡,因此現(xiàn)階段作為獨立軟件去使用會更符合自身定位。
·結語
自去年10月發(fā)布銳炫GPU以來,英特爾在短時間內大幅優(yōu)化了DX9游戲體驗,并且重新設計了DX11驅動,帶來了高達19%左右的游戲性能提升以及大約20%的99百分位提升。
此外,英特爾全新引入GPU Busy指標去衡量游戲過程中CPU與GPU之間的平衡關系,并且可以幫助用戶通過更改游戲畫質設定、分辨率設定等來提升硬件效率。同時,英特爾推出全新的Intel PresentMon Beta測試工具,終端用戶可以自由下載,并通過它來監(jiān)測電腦狀態(tài),了解自己電腦的GPU Busy指標。