- 2021/11/11 16:30:49
- 类型:原创
- 来源:电脑报
- 报纸编辑:电脑报
- 作者:
上周末,Intel首次发布了ARC原型显卡搭载的XeSS超级采样技术的游戏实机演示,标志着8月在Intel ARC独显发布时宣布的几个特有技术都开始进入实用化阶段,也标志着ARC独显离进入量产又迈进了一步。
那么,XeSS这个Intel用来挑战DLSS和FSR的自家超级采样技术,究竟是怎么回事?其效果如何呢?
实机演示,效果惊人
这次实机演示是在动作+塔防大作Riftbreaker上进行的。由于没有限制单位数量、场景宏大加上建模精细,粒子效果繁多,所以游戏实际上对显卡的负担是相当重的,随着游戏往后期发展,敌我双方的建筑、作战单位越来越多,离子爆炸特效也越来越多,越来越频繁,对帧率的影响也越来越大。
不过在演示视频中,我们可以看到游戏一直保持以较高的的帧率在运行,而原生4K、1080P、超级采样缩放后的4K画面的对比,经过XeSS超级采样处理的4K画面保持了较多原生画面的细节,同时比1080P的原生画面更为清晰,可见还是颇有功力和效果的。
1080PXeSS超级采样放大到4K后居然还比原生1080P画面更为清晰
XeSS,第一个“双引擎”超级采样技术
XeSS的全称是Xe Super Sampling,即“Xe 超级采样”,Xe指的是以ARC等为代表的新一代Intel图形芯片架构技术。
XeSS让我们开眼界的第一点是,它是目前业界第一个“双引擎”的超级采样技术。
我们知道,目前NVIDIA和AMD的超级采样技术基本都是一个技术路线进行推进,有着不同的适用范围。例如NVIDIA的DLSS是基于RTX显卡的Tensor人工智能机器学习核心,所以它也只能在RTX显卡上生效,支持的游戏需要进行预先学习训练,并随着学习训练的深入,而获得越来越好的帧率优化效果;而FSR是基于开源的Lanczos缩放算法进行优化后形成的新开源超级采样算法,理论上可以适用于所有显卡硬件,但究其根本还是“缩放”;而XeSS则不同,它在Intel自身硬件上,通过XMX(Xe Matrix eXtensions,Xe矩阵扩展)这个引擎来进行超级采样,XMX实际上是硬件核心,类似NVIDIA的TENSOR机器学习核心,因此XeSS实际上也是通过机器人工智能深度学习实现;而在其他硬件上,它则通过DP4a指令集来实现超级采样,效率和效果都会有一定折扣,但能够适应更多的硬件——注意,也不是“所有”图形硬件。
这让XeSS成为了业界第一个“双引擎”工作机制的超级采样技术。
DP4a指令集是Intel在11代酷睿推出时推出的“深度学习加速指令集(Intel DL Boost)”中包含的新特性,当时在Xe集成显卡上为神经网络推理提供了DP4a支持,首次为 INT8 数据类型提供原生支持,可将 AI 性能提升多至 5 倍。
DP4a通过对INT8类数据类型计算支持,大大提高了深度学习的效率
而DP4a随后又加入SM6.4的渲染核心技术,并添加到DX12的新特性当中。所以,只要支持SM6.4的显卡,理论上都会支持DP4a,从而也可以在显卡中适用XeSS这个人工智能机器深度学习的超级采样技术。
采用DP4a软件算法的XeSS效果略低于硬件XMX引擎的XeSS
那么,哪些显卡/CPU目前已经支持了DP4a呢?
AMD:RDNA2架构显卡、7nm Vega显卡,今后可能RDNA1也支持
NVIDIA:安培架构显卡、图灵架构显卡、帕斯卡架构显卡
XeSS,有啥新特性
Intel在为ARC独显开发超级采样技术的时候,就已经认识到:XeSS的主要目标,是在不损失任何帧或质量的情况下将图像提升到更高的分辨率,最终产生最高质量的渲染,具有最精确的照明,有最详细的阴影和反射效果,并以平稳的帧速率引入到场景中。
1.XeSS通过深度学习,将运动矢量数据考虑在内,以预测附近的像素并重建图像,不是简单空间缩放。
因此,举例来说,如果我们取10个帧,而且每个帧都是动态的,帧中的物体在移动,那么就很难正确地放大图像,因为一帧中的像素可能在下一帧中不存在了。这就是神经网络大显身手的地方,因为它们可以帮助找出丢失的像素,然后通过人工智能和机器学习从相邻的像素重新建立起来细节。这与只限于空间放大的FSR是截然不同的——FSR只能根据已经呈现的像素进行优化计算和缩放。
2.XeSS不需要针对每个游戏单独适配训练学习。
我们知道,最早的NVIDIA DLSS1.0作为人工智能深度学习的超级采样技术,是需要通过配置超级计算机的NVIDIA深度学习适配中心,做适配学习的。待适配学习结束,形成了不断自我优化学习的“套路”时,才会以新驱动的形式,下发到显卡上实现DLSS,并让显卡进一步自行优化DLSS效果。
而对于XeSS,每个游戏都不需要自己单独适配训练,类似DLSS 2.0这样的基于神经网络的广义技术。例如,在8月的Intel Architecture Day上展示的虚幻引擎演示版本第一次使用XeSS,但XeSS之前从未接受过升级演示的学习训练,但也仍然取得了比较好的效果。
这张虚幻5 XeSS超级采样渲染图并未经过特殊适配学习
3. XeSS机器学习分辨率更高,并将支持8K分辨率超级采样
DLSS训练的分辨率是16K,而XeSS实际上是32K。模型训练为“每像素64个样本参考图像”。这意味着每个X和Y轴都有8个样本,总共是32个,因此有效的分辨率是32K。64x SSAA是XeSS机器学习的目标质量。对XeSS的8K支持也在开发中。
4.XeSS 2.0和XeSS 3.0已经在路上。
英特尔承认XeSS在8月发布时并不完美。随着神经网络技术和英特尔ARC显卡开发的推进,XeSS 2.0甚至3.0版本都将问世,进行迭代优化。
5.XeSS有多种质量模式
XeSS和DLSS、FSR一样,将有不同的质量模式。性能模式是为了获得最高的FPS,但同时也带来了最明显的质量下降。质量模式以更高的内部分辨率呈现,以提供更好的质量,但在这个过程中牺牲帧率。但XeSS追求的是性能模式产生的图像质量是十分接近超质量模式,不需要过分牺牲视觉体验。
6.XeSS将会开源
XeSS技术将会开源,无论是XMX引擎还是DP4a指令方式,都将采用同一套API接口和SDK开发包,方便游戏开发者进行适配。
总结
从最新的演示我们可以看出,目前XeSS已经初步实现了其预期目标。而对XeSS的理解,我们可以概括为:Intel新的,可以通过硬件和软件方式实现相近效果的,基于人工智能机器深度学习的图像超级采样技术。
随着ARC显卡的临近,我们也有理由相近,未来随着超级采样技术的普及,越来越多的中低端显卡将会获得如今中高端显卡才有的游戏体验。至于实际效果到底如何,让我们等待Intel ARC显卡的上市吧。
Copyright © 2006-2021 电脑报官方网站 版权所有 渝ICP备10009040号-1