早些时候有消息称,Intel将会在下一代Haswell架构处理器中加入第四级缓存,而很快这个消息就被否定,不了了之。而最近,在Haswell移动平台处理器和高端桌面级处理器的核芯显卡GT3,又被证实将会配有自己的EDRAM缓存,最大容量有可能达到128MB,后来也有消息称应该为64MB。
Haswell中的四级缓存
四级缓存和EDRAM缓存又有什么联系呢?其实GT3中的EDRAM缓存,也就是四级缓存。GT3核芯显卡中自带的EDRAM缓存被称为GT3e,而GT3e核芯显卡的特别版Haswell也有着自己的代号“Crystal Well",然而这类产品,只会出现在超极本笔记本等移动平台处理器和高端桌面级处理器。但是有关四级缓存也众说纷纭,有人表示,这只是核芯显卡专属的,CPU是无法使用的,也有人表示,四级缓存很有可能和一级,二级,三级,缓存一样,能够同时被GPU与CPU使用。
如果四级缓存是专门为GPU提供的话,可以预测,核芯显卡的性能将会高幅提高。而如果是GPU与CPU两者可以共同使用话的,那就意味着CPU与GPU是统一寻址,意义更大。
而根据之前有关于Haswell GPU会支持InstantAccess技术,部分实现CPU与GPU共同寻址的说法,这个EDRAM缓存共享也是有可能的。
InstantAccess技术
“InstantAccess”(即时访问),也就是Intel版本的“零拷贝”(Zero Copy),有点融合统一寻址的意思。这与AMD在Llano APU中使用的技术类似。
Intel核芯显卡一直在共享系统内存,但是CPU、GPU各自独立,并不能直接访问对方的寻址空间。
简单的说,GPU如果需要使用CPU内存里的东西,必须首先自己拷贝一份。随着异构计算的兴起,CPU、GPU同时利用内存里的相同数据已经是大势所趋。
有了InstantAccess,Intel显卡驱动就能提供一个关于GPU显存位置的指针,CPU可以直接访问它。CPU无需拷贝就能使用GPU地址。
InstantAccess优势
如果说InstantAccess技术对用户有什么影响的话,那当然是速度的提升。按照上一代核芯显卡的工作流程,GPU首先要拷贝一份CPU内存里的东西,这个过程肯定是需要时间的,这个过程时间的消耗,将会降低计算机本身的执行效率,拖慢性能。
而InstantAccess技术,将能够使GPU直接访问CPU内存的数据,减少了拷贝时间,从而提高执行效率。
共同进步还恶补短板?
按照去年Fudzilla的说法,从晶体管规模的变化来看,同频下Haswell的CPU性能会比Ivy Bridge提高10%以上,如果算上AVX 2.0指令集以及软件优化的话,提升更多也不是没可能。IVB架构处理器的性能已经十分可观,再加上10%的提升,处理器性能已经绰绰有余。笔者现在还在使用SNB架构处理器的笔记本产品,并未觉得性能不够用。
10%的处理器性能提升虽然不多,但是依旧保持着与其他对手相当可观的性能优势。而Intel的核芯显卡,相较于APU,还有一定差距,可以说,GPU性能是Intel一个软肋。四级缓存共用,在长远看来,非常具有意义,但是图形性能提升还是不及GPU单独使用来的明显。毕竟在GPU的性能上,Intel还暂时处于劣势,期待Haswell能够扳回一城。
我想说的是:
GT3只会出现在笔记本超极本等移动平台和高端桌面级平台。对于超极本和笔记本等,较为看重移动性和续航性能的产品而言,核芯显卡的低功耗以及小体积都是独显所不能达到的。所以在超极本和笔记本产品中,急需性能强大的核芯显卡来应对日益复杂的图形处理需求。而在高端桌面领域,CPU的性能已经十分强劲,InstantAccess对其性能的提升,并不会给用户带来明显的体验差异,所以,采用共享四级缓存的方案并不具有实际意义。
另外,根据2013年在北京举行的IDF峰会中,施浩德也提到了,Haswell的图形性能相比IVB的图形性能,会有两倍的增长,可以取代目前在中国80%以上的独立显卡。如果施浩德所说的情况属实,Haswell中的核芯显卡又是如何做到如此大幅度的提升的呢?这很有可能与其四级缓存有关系。
由此,笔者推断,在Haswell处理器中所加入的四级缓存,作为GPU独享缓存可能性更大。如果笔者的假设成立,Haswell所搭载的核芯显卡性能,将非常可观。当然,这也仅仅是笔者根据现有数据的一些推测,四级缓存到底是GPU独享还是CPU与GPU共享,还要等待Haswell的最终发布。