核弹再升级 英伟达Tegra X1解析
在CES 2015上,英伟达首先抛出了一颗重磅炸弹:Tegra X1,在发布时,英伟达宣城新的X1处理器的性能达到了上代K1的两倍,这也就意味着Tegra X1成为了当今市面上性能最强悍的移动处理器,下面请跟我们一起来看X1到底有多强,又强在哪里吧。
首先从英伟达的老本行GPU开始分析,早在GTC 2014的时候,英伟达就宣称下一代Tegra处理器将使用Maxwell架构的GPU,而Maxwell架构早就在桌面级的GPU上出现过了,而英伟达为了把这个架构放在移动处理器之上也是下了不少功夫,和Tegra K1的Kepler GPU不一样,X1上的Maxwell GPU可以算是从0开始全新设计的,而不是某个随随便便移植的作品。
当英伟达决定将移动处理器业务放在第一位的时候,这家公司的野心可见一斑,对于Tegra而言,高优先级的待遇意味着英伟达最新和最强的GPU都会以更快的速度登陆移动处理器——Maxwell 1的发布和Tegra X1的发布仅仅相隔了一年,相较于Kepler和K1两年的时间间隔确实短了很多。
此外,高优先级同样意味着英伟达将从架构底层上为移动处理器做出专属的功耗优化,而这一点不仅对于Tegra有利,对于桌面级的GPU的能耗降低也是有着显著作用的。
如此而来,Tegra X1就是英伟达这个策略下的第一个产物,这对于英伟达来说也是意义深远,得益于这样的产品策略,Tegra X1在已经非常强大的Tegra K1的基础上又获得了进化,而这些进化很多还是得益于使用了Maxwell架构。在CPU部分,英伟达决心要做市面上最强的CPU,所以英伟达也找上了ARM要来了A57架构(不过鉴于今后一段时间之内高端的CPU架构基本都会是A57,所以Tegra X1的最大武器依旧是那颗丧心病狂的GPU)。
进一步深入Tegra X1的GPU,我们所看见的是一颗为了Tegra而设计的Maxwell-2 GPU,相对于前作的Kepler,Maxwell 2架构加入了一系列的新功能,其中包括了第三代的多边形彩色压缩技术,每个CUDA核心的能效比也获得了提升,其他图形方面的功能还包括保守型光栅化算法、立体化覆盖资源和多帧抗锯齿等,这些听起来很酷的功能统统被塞进了Tegra X1之中。
在X1之中,英伟达对内存带宽和总体效率的改进在所有改进之中是最重要的,因为这两点基本就是移动处理器的瓶颈所在,在对于内存带宽的优化上,移动处理器厂家对于高端移动处理器的做法往往是对内存总线频率(Memory Bus)进行升级(升级到96位或者128位),这种简单粗暴的方法当然是效果最好并且最直观的,但是升级内存带宽就意味着升级成本和增加移动处理器以及周边设备的复杂度,在X1上,英伟达仍旧采用了64位的内存总线,于是为了不让性能强大的GPU饿着,英伟达加入了数据压缩,再配上LPDDR4的更新换代,X1的GPU效能才能获得全面发挥。
此外移动处理器的散热设计功耗(TDP)也是一个限制因素,对这方面进行改进的好处也是大大的:在降低处理器功耗的同时还能够提升性能,对发热进行控制也使得处理器在连续不断工作的时候表现更佳,这也就是为什么X1要使用台积电的20纳米工艺来对Maxwell的功耗进行优化。
最后但最重要的部分,就是X1还具有一个移动GPU专属的功能,而这个功能在桌面GPU上是没有出现的,而这个功能被英伟达称为“Double Speed FP16”,在加入这个功能之后,CUDA单元能够在FP16之下达成更高的性能,这在部分应用场景下是有用的。
和之前的Kepler和Fermi一样,Maxwell仅具有特定的FP32和FP64 CUDA核心,X1自然也不例外,在知晓了FP16的重要性之后,X1有着处理FP16任务独特的方式。在K1之上,FP16被简单地提升到FP32并调用FP32核心进行处理,而X1会将两个FP16包在一起变成一个单个的Vec2包,然后交由一个FP32 CUDA核心进行处理。
一言以蔽之,X1能够将同一个进程之中的两个FP16进行打包处理,打包之后,X1对于CUDA核心的利用就更加充分和灵活。
其实这也不是啥新奇的想法了,英伟达的竞争对手早就开始这么干了,总体来说这种处理方法依旧有点投机取巧的味道,ARM和Imagination在当下的GPU之中都具有FP16的兼容能力(要么就是有FP16处理单元或者更优良的ALU调配),而甚至AMD也要加入了,英伟达这么做也是情理之中。
但FP16的重要性又在哪里呢?这个其实说来话长,简单点说,FP16广泛地存在于Android的显示排序工作之中,因为对于Android来说这种低精度的计算对于省电是至关重要的;此外,FP16运算还在移动游戏领域有一定的地位,此外,FP16还存在于图像识别应用之中(比如英伟达自己的Drive PX平台)。
虽然FP16也有它自身的限制——16位对于现在的浮点数来说也确确实实不够了,不过在包括上方提到的应用之中,FP16依旧有着重要的发挥,由此对FP16快速准确的处理也显得重要起来了。
在功能性上就这么多了,剩下的就是用数据说话的时间。
总的来说,X1的GPU由两个Maxwell SMM塞进一个GPC组成,总的CUDA数量达到了256个,相比K1的单SMX直接翻倍,这也就意味着诸如几何和纹理单元这样的基础东西也加倍了,X1上能耗比更优的CUDA核心也使得Kepler望尘莫及。
除了CUDA核心数量之外,英伟达还对光栅ROP单元进行了修改,X1这回有了16个ROP,达到了K1的四倍,而这个ROP数量也赶上了GM107的ROP数量,这个提升对于X1支持4K@60Hz也是至关重要的,同时升级的带宽管理策略(效率和实际带宽均有)也保证了这些ROP在处理重型任务的时候不会饿着。
最后,我们还是不可避免地回到了谈论时钟频率和预期性能方面,英伟达官方暂时还没有公布X1的GPU频率,不过根据他们公布的性能数据来看,还是能猜出一点端倪的:英伟达宣称X1的FP16处理能力达到了1TFLOPs,由此推算,这颗GPU的最大频率可能已经达到了1GHz(1GHz×2FP16×2FMA×256=1TFLOPs)。
这个频率水平基本已经是桌面计算机级别的了,而这样的高频率对于一款移动处理器来说也已经是非常激进了,而对于X1最终将以什么形式落到消费者的手中依旧还是个未知数,目前唯一确定的就是搭载Tegra X1的设备肯定不会在短时间之内与我们见面(当然对于英伟达自家的产品就不一定了),这样的一颗核弹满速运转的时候,功耗和散热也会是一个无法回避的问题。
ViaAnandtech
更新:现场性能测试 byHardwarezone
3D Mark性能,得分达到43241分,为苹果A8X的两倍。
GFXBench跑分,帧数炸裂。
平均功耗图,作为对比的苹果A8X平均功耗为2.651瓦,X1的平均功耗为1.498瓦,这个功耗如果再控制一下,Tegra X1上手机还真不是不可能的。
英伟达移动掌机来了!这次的杀手锏是AI?
早在2004年,索尼发布了旗下PlayStation系列的首款掌机设备——PlayStation Portable(PSP),自此,掌上游戏机这一品类开始风靡全球。
不过随着PC市场的发展及掌机市场的萎缩,游戏掌机逐渐从我们的视野中消失。直至任天堂Switch这款现象级产品的出现,掌机市场才重新焕发出活力。尽管任天堂一直强调Switch是一台主机,但其掌机形态的便捷性是许多用户选择入坑Switch的核心原因。
近两年,除了我们熟知的任天堂外,V社、ROG、AYANEO、GPD等国内外的大小厂商纷纷选择入局掌机市场。虽然场面看上去十分热闹,但实际上只有V社的Steam Deck成功跑出,预估市场持有量应该在300-400万台之间。
图源:雷科技
任天堂Switch和V 社(Valve)Steam Deck的出色表现证明:游戏掌机是游戏市场的新趋势。
据Moore’s Law Is Dead透露,英伟达要入局游戏掌机领域,目前正在开发自己的PC游戏掌机,并考虑扩充推出专属 IP(知识产权)的图形芯片。
英伟达再战移动掌机
事实上,这是英伟达第二次涉足游戏掌机领域。
第一款产品神盾掌机Nvidia Shield给许多玩家留下了深刻印象,它是全球首款拥有四核处理器TEGRA 4及主动散热的掌机,5英寸720P的LCD屏幕加上一块7350mAh的大电池在当时属于领先水平。可惜随着时间推移,Nvidia Shield没能在游戏掌机市场占据一席之地,最终成为了一款4K HDR流媒体设备。
图源:B站@博van小哥哥
Nvidia Shield遇挫是英伟达探索移动领域的缩影。 相比起PC领域的成功,英伟达在移动领域的发展一直都不太顺利。
英伟达Tegra4,是英伟达手机芯片领域的代表作,同时也是谢幕之作。这款芯片是手机行业内首个四核SoC,加上性能不弱的GPU,使其在跑分上甚至要高于当年的旗舰芯片骁龙800。但由于高功耗、GPU落后以及外挂基带芯片等问题,使用Tegra4芯片的手机少之又少,只有小米、中兴等少量机型使用。这导致英伟达退出了手机芯片市场,后续Tegra K1芯片也只在小米平板等非手机平台上出现过。
图源:engadget
如果说英伟达在游戏掌机最成功的案例,莫过于与任天堂合作开发的Switch平台了。两者在演算法、系统、API、游戏引擎等方面通力合作,共同打造了这款现象级游戏机。
除了Switch外,英伟达其他经历都算不上成功,但也让英伟达在移动领域积累了足够的经验。如果将Nvidia Shield比作试水,将合作开发Switch比作学习实践,那这次开发自研游戏掌机显然就是英伟达入局游戏掌机市场的正式宣告。
英伟达与任天堂合作的Switch大卖,让英伟达看到了游戏掌机市场的潜力,加上英伟达一直对移动市场抱有期待。英伟达不再满足于只做任天堂Switch的芯片供应商,自立门户或许能给英伟达创造更大的利润。
但无论如何,英伟达的入局意味着游戏掌机市场进入混战局面,AMD在游戏掌机一家独大的局面也将被打破,游戏玩家可以在掌机上玩到来自主机、PC 以及手机(移动)平台的游戏平台,不同类型和背景的厂商也在争取主机、PC 和手机游戏的玩家们。
AI掌机让英伟达弯道超车?
随时随地畅玩游戏,是大部分游戏玩家的强烈需求。手持游戏类设备正是顺应这个需求,成为PC和主机市场新的流行趋势。
很多硬件和平台厂商都在研究如何让玩家将他们的主机和PC游戏带到其他设备游玩,以达到提高留存率促进消费的目的。
像本地Wi-Fi远程游戏串流(索尼PlayStation Portal)、原生的掌上游戏PC(Steam Deck和华硕ROG Ally)、云游戏设备(罗技 G Cloud)等都是对应平台的补充性设备。
在V社、联想、华硕这些大厂入局前,游戏掌机还是一个相对小众的市场。但随着入局者的增多,不同形式的游戏掌机解决方案令市场变得更为复杂。英伟达如果想通过核心性能等硬件从游戏掌机市场突围并不容易,或许另寻僻径是更好的选择。
图源:ROG
近两年,AI成为了全行业追捧的风口,但在掌机领域甚少被提及。 直至今年年初,微星才发布了号称首款AI掌机的微信Claw。该说不说,尽管微星敏锐的捕捉到了这一热点,但也仅仅擦了酷睿Ultra具备一定AI运算能力的边。据官方介绍,微星Claw可以根据应用场景的负载调整性能和续航,也就是通过AI合理调度分配设备性能。
PC掌机本质上就是PC,技术路线和内容生态与其他类型游戏掌机有着明显区别。AI PC产品的技术路线可以为PC掌机提供参考价值,除了能耗、性能的硬件优化外,扩充PC掌机的使用场景,例如挖掘办公属性、与其他AI设备联动、引入大模型......可能才是真正让PC掌机步入主流的关键。
游戏掌机始终只是一个小众市场,众多大厂进入后势必会瓜分本就有限的利润空间,其中头部厂商在长期耕耘下或许只能带来少量利润,这显然不符合大厂们的盈利需求。只有突破游戏这个单一属性,PC掌机才会变成大众市场。
虽然暂时不清楚英伟达开发的游戏掌机属于哪种类型,但小雷个人认为PC掌机或许是一个好的选择。英伟达与其将掌机产品困在游戏领域,与其他拥有平台优势的竞品对抗,倒不如主动跳出游戏掌机这个概念,在PC掌机领域寻求更多可能性。
当掌机从专门的游戏设备变成便携PC,这条赛道的可能性将被无限放大。
相关问答
NVIDIA Tegra 4 、高通骁龙800这两个哪个更好?说详细,谢谢-Z...NVIDIATegra4和高通骁龙800是两个不同的处理器系列,它们在性能、功耗和使用场景上存在差异。下面我将对它们进行详细对比。首先,从性能来看,高通骁龙800采用...
flyone是什么牌子?Flyone是一款平板电脑品牌。NVIDIA英伟达与汇威联手打造发烧级平板电脑Flyone。搭载安卓系统,提供浏览互联网,收发电子邮件,观看电子书,播放音频活视频、...
Nvidia Tegra 2比,哪个更好点?哪个显卡好点??-ZOL问答NvidiaTegra2完胜高通骁龙SnapdragonMSM8655,显示也是最好的。有用(0)回复...11.7万浏览4回答惠威m200mkiii配乐之邦02US02US...
M3是什么手机?M3是小米3手机。小米手机3采用了全球首发的NVIDIATegra4和高通骁龙800最新版“8×74AB系列”中的8274AB(联通制式)和8674AB(电信制式)顶级四核处理器。...
手机芯片: 英伟达4 和高通骁龙800的具体对比? - 小红薯45EB1FA...一份最新的报告显示,NVIDIA公司的Tegra4处理器将在运算速度上击败高通Snapdragon800处理器。鉴于目前Tegra4处理器并没有真正上市,所以这份报告结论...
Tegra 4 能够玩大型游戏吗?会不会出现散热的问题?平板玩游戏肯定不如台式机快了,但是平板还是有优势的。听说Tegra4处理器散热还是不错的,有专门的针对性设计,所以大家可以放心的玩游戏不用担心的。平板玩游...
手机芯片: 英伟达4 和高通骁龙800的具体对比? - sES5tdRCc 的...一份最新的报告显示,NVIDIA公司的Tegra4处理器将在运算速度上击败高通Snapdragon800处理器。鉴于目前Tegra4处理器并没有真正上市,所以这份报告结论...
德州仪器, 英伟达 的处理器去哪了?英伟达大家都很熟悉了,老黄家的显卡无人不知,根据最新财报显示,由于受个人电脑、游戏设备以及数据中心使用的图形芯片需求强劲推动,英伟达第三财季营收达到...此...
other电脑是什么品牌?other平板电脑是英伟达牌子!英伟达平板电脑,Tegra4处理器的平板电脑,NVIDIA英伟达与广东汇威高科技有限公司联手打造发烧级平板电脑。other搭载安卓系统,提...
手机 英伟达Tegra 2可秒杀高通同类双核CPU吗?(手机)?Tegra2确实可以对付当年的高通双核,但是总的来说英伟达的手机处理器并不是非常理想的选择。英伟达在Tegra4推出之后,基本上已经淡出了手机市场,现在Tegra处理...