核弹再升级 英伟达Tegra X1解析
在CES 2015上,英伟达首先抛出了一颗重磅炸弹:Tegra X1,在发布时,英伟达宣城新的X1处理器的性能达到了上代K1的两倍,这也就意味着Tegra X1成为了当今市面上性能最强悍的移动处理器,下面请跟我们一起来看X1到底有多强,又强在哪里吧。
首先从英伟达的老本行GPU开始分析,早在GTC 2014的时候,英伟达就宣称下一代Tegra处理器将使用Maxwell架构的GPU,而Maxwell架构早就在桌面级的GPU上出现过了,而英伟达为了把这个架构放在移动处理器之上也是下了不少功夫,和Tegra K1的Kepler GPU不一样,X1上的Maxwell GPU可以算是从0开始全新设计的,而不是某个随随便便移植的作品。
当英伟达决定将移动处理器业务放在第一位的时候,这家公司的野心可见一斑,对于Tegra而言,高优先级的待遇意味着英伟达最新和最强的GPU都会以更快的速度登陆移动处理器——Maxwell 1的发布和Tegra X1的发布仅仅相隔了一年,相较于Kepler和K1两年的时间间隔确实短了很多。
此外,高优先级同样意味着英伟达将从架构底层上为移动处理器做出专属的功耗优化,而这一点不仅对于Tegra有利,对于桌面级的GPU的能耗降低也是有着显著作用的。
如此而来,Tegra X1就是英伟达这个策略下的第一个产物,这对于英伟达来说也是意义深远,得益于这样的产品策略,Tegra X1在已经非常强大的Tegra K1的基础上又获得了进化,而这些进化很多还是得益于使用了Maxwell架构。在CPU部分,英伟达决心要做市面上最强的CPU,所以英伟达也找上了ARM要来了A57架构(不过鉴于今后一段时间之内高端的CPU架构基本都会是A57,所以Tegra X1的最大武器依旧是那颗丧心病狂的GPU)。
进一步深入Tegra X1的GPU,我们所看见的是一颗为了Tegra而设计的Maxwell-2 GPU,相对于前作的Kepler,Maxwell 2架构加入了一系列的新功能,其中包括了第三代的多边形彩色压缩技术,每个CUDA核心的能效比也获得了提升,其他图形方面的功能还包括保守型光栅化算法、立体化覆盖资源和多帧抗锯齿等,这些听起来很酷的功能统统被塞进了Tegra X1之中。
在X1之中,英伟达对内存带宽和总体效率的改进在所有改进之中是最重要的,因为这两点基本就是移动处理器的瓶颈所在,在对于内存带宽的优化上,移动处理器厂家对于高端移动处理器的做法往往是对内存总线频率(Memory Bus)进行升级(升级到96位或者128位),这种简单粗暴的方法当然是效果最好并且最直观的,但是升级内存带宽就意味着升级成本和增加移动处理器以及周边设备的复杂度,在X1上,英伟达仍旧采用了64位的内存总线,于是为了不让性能强大的GPU饿着,英伟达加入了数据压缩,再配上LPDDR4的更新换代,X1的GPU效能才能获得全面发挥。
此外移动处理器的散热设计功耗(TDP)也是一个限制因素,对这方面进行改进的好处也是大大的:在降低处理器功耗的同时还能够提升性能,对发热进行控制也使得处理器在连续不断工作的时候表现更佳,这也就是为什么X1要使用台积电的20纳米工艺来对Maxwell的功耗进行优化。
最后但最重要的部分,就是X1还具有一个移动GPU专属的功能,而这个功能在桌面GPU上是没有出现的,而这个功能被英伟达称为“Double Speed FP16”,在加入这个功能之后,CUDA单元能够在FP16之下达成更高的性能,这在部分应用场景下是有用的。
和之前的Kepler和Fermi一样,Maxwell仅具有特定的FP32和FP64 CUDA核心,X1自然也不例外,在知晓了FP16的重要性之后,X1有着处理FP16任务独特的方式。在K1之上,FP16被简单地提升到FP32并调用FP32核心进行处理,而X1会将两个FP16包在一起变成一个单个的Vec2包,然后交由一个FP32 CUDA核心进行处理。
一言以蔽之,X1能够将同一个进程之中的两个FP16进行打包处理,打包之后,X1对于CUDA核心的利用就更加充分和灵活。
其实这也不是啥新奇的想法了,英伟达的竞争对手早就开始这么干了,总体来说这种处理方法依旧有点投机取巧的味道,ARM和Imagination在当下的GPU之中都具有FP16的兼容能力(要么就是有FP16处理单元或者更优良的ALU调配),而甚至AMD也要加入了,英伟达这么做也是情理之中。
但FP16的重要性又在哪里呢?这个其实说来话长,简单点说,FP16广泛地存在于Android的显示排序工作之中,因为对于Android来说这种低精度的计算对于省电是至关重要的;此外,FP16运算还在移动游戏领域有一定的地位,此外,FP16还存在于图像识别应用之中(比如英伟达自己的Drive PX平台)。
虽然FP16也有它自身的限制——16位对于现在的浮点数来说也确确实实不够了,不过在包括上方提到的应用之中,FP16依旧有着重要的发挥,由此对FP16快速准确的处理也显得重要起来了。
在功能性上就这么多了,剩下的就是用数据说话的时间。
总的来说,X1的GPU由两个Maxwell SMM塞进一个GPC组成,总的CUDA数量达到了256个,相比K1的单SMX直接翻倍,这也就意味着诸如几何和纹理单元这样的基础东西也加倍了,X1上能耗比更优的CUDA核心也使得Kepler望尘莫及。
除了CUDA核心数量之外,英伟达还对光栅ROP单元进行了修改,X1这回有了16个ROP,达到了K1的四倍,而这个ROP数量也赶上了GM107的ROP数量,这个提升对于X1支持4K@60Hz也是至关重要的,同时升级的带宽管理策略(效率和实际带宽均有)也保证了这些ROP在处理重型任务的时候不会饿着。
最后,我们还是不可避免地回到了谈论时钟频率和预期性能方面,英伟达官方暂时还没有公布X1的GPU频率,不过根据他们公布的性能数据来看,还是能猜出一点端倪的:英伟达宣称X1的FP16处理能力达到了1TFLOPs,由此推算,这颗GPU的最大频率可能已经达到了1GHz(1GHz×2FP16×2FMA×256=1TFLOPs)。
这个频率水平基本已经是桌面计算机级别的了,而这样的高频率对于一款移动处理器来说也已经是非常激进了,而对于X1最终将以什么形式落到消费者的手中依旧还是个未知数,目前唯一确定的就是搭载Tegra X1的设备肯定不会在短时间之内与我们见面(当然对于英伟达自家的产品就不一定了),这样的一颗核弹满速运转的时候,功耗和散热也会是一个无法回避的问题。
ViaAnandtech
更新:现场性能测试 byHardwarezone
3D Mark性能,得分达到43241分,为苹果A8X的两倍。
GFXBench跑分,帧数炸裂。
平均功耗图,作为对比的苹果A8X平均功耗为2.651瓦,X1的平均功耗为1.498瓦,这个功耗如果再控制一下,Tegra X1上手机还真不是不可能的。
英伟达 Tegra 处理器的市场接受度为何一代不如一代?
从Tegra2到现在的Tegra K1,市场接受度是越来越低,Tegra2当年可是摩托罗拉、LG、还有几家国产品牌力挺,Tegra3好歹有HTC One X和Nexus7采用了,Tegra4就明显没有国际大厂敢用到旗舰上了,小米也就是冒死只用在移动版上,Tegra K1到现在好像只有黄仁勋自己厂的游戏机准备用吧。有人来给分析分析原因吗?
------------------
网友烫走解答:
尝试回答一下这个问题,不一定绝对客观,但至少应该能给大家一个新的角度。
Mobile 对于 NVIDIA来说很重要。但是放眼望去市场竞争激烈。有冰雪聪明看准机会的高通,SoC 集成度高,在 ARM 架构和基带上积累多,几乎抓住了所有移动设备厂商最迫切的需求;有把 SoC 极度商品化的 MTK,TTM 短,市场细分好,跟车间似的一年好多款 SoC 顺便提供板级解决方案,让妈妈开了又开;还有高富帅Intel,高、富、帅。
黄仁勋一看,捏了捏肚子说还是打差异化吧,我们是视觉计算公司,感觉自己萌萌哒。要 disrupt the market,于是 2008 年 Tegra 诞生了。其实从那时起 Tegra 集成 NV 自己的 GPU 架构就是计划中的事情,因为只有这样才能 add value,利用好公司的强项。老黄更多地认为 mobile 同 PC 和 cloud 一样,也是计算平台,未来视觉计算会越来越重要。他看好 Androidgaming,相信 mobile is more than phones。
手上有张图:
Tegra 是 mobile platform 上的品牌(SHIELD 里面也是 Tegra)。再看高通这种以通信作为灵魂的公司,对 mobile 的理解和定位一定不是这个样子的。那做出来的 SoC 在手机上卖得比 Tegra 好,我觉得不是很正常么。
所以回答题主, NVIDIA 的强项在移动平台目前还没能得到很好的利用和展现,想通过 Tegra K1 逐步引导市场对于视觉计算的需求。但是手机作为移动设备中的一个重要成员,对基带的要求又很高。Tegra 实际正用自己的短板撬竞争对手的巨石。
当然短板肯定要补的。NVIDIA 在 2011 年收购了 Icera,一个做基带的公司,至于什么时候 NV 自己的基带成为标配就不清楚了。
相关问答
Nvidia Tegra2 比,哪个更好点?哪个显卡好点??-ZOL问答NvidiaTegra2完胜高通骁龙SnapdragonMSM8655,显示也是最好的。有用(0)回复LLD7273168二手HD4870有用(0)回复fish1986117你这...
a5cpu和 Tegra 2 谁更厉害-ZOL问答不过,两款处理器规格上有一个最大的不同,苹果A5采用了ImaginationTechnologies公司的PowerVRSGX543双核显示芯片,而Nvidia的Tegra2却使用了自己的Gef...
melon是什么牌子电脑?melon是美乐品牌。品牌/型号美乐视界品牌美乐视界处理器英伟达NVDIATegra2,ARMCortex-A9双核内存容量1GB产品类型平板电脑硬盘容量8GB操作系统....
melon电脑怎么样?melon电脑还不错。美乐视界品牌美乐视界处理器英伟达NVDIATegra2,ARMCortex-A9双核内存容量1GB产品类型平板电脑硬盘容量8GB操作系统Androi...
thinkpad接口类型?SDHC)。ThinkPadTablet搭载了Android...thinkpad支持3.5mm耳机接口、MiniHDMI接口、MicroUSB接口、数据线接口、3GSIM卡槽、3合一读卡器...
什么手机支持mhl功能?支持mhl功能的手机有:华为U9200、AscendDQuad、魅族MX、魅族MX2、华为AscendD1、中兴Era、AscendP2、中兴PF200、中兴U970、AscendP1等。...
什么手机支持MHL功能?支持mhl功能的手机有:华为U9200、AscendDQuad、魅族MX、魅族MX2、华为AscendD1、中兴Era、AscendP2、中兴PF200、中兴U970、AscendP1等。...
mxplayer播放器怎么安装?1、MXplayer是安卓手机上最牛的播放器之一,安装很简单,下载apk一路安装完成,装的时候一定要注意,要装对应的版本。2、如果你的手机不太旧,直接装文件名里...
推荐一个下载和播放flv格式视频的软件?下载个MXplayer播放器!全能播放器MXVideoPlayer是一款视频播放器,MXPlayer支持3GP、AVIDIVX、F4V、FLV、MKV、MP4、MPEG、MOV、VOB、W...
手机安卓系统哪个视频播放器能按顺序播放被切割的视频电影?mxplayerpro,BSPlayer,DicePlayer,MoboPlayer任一应用都很强大。MXVideoPlayer(梦想播放器)是Android平台上的第一款能够支持多核解码...