核弹再升级 英伟达Tegra X1解析
在CES 2015上,英伟达首先抛出了一颗重磅炸弹:Tegra X1,在发布时,英伟达宣城新的X1处理器的性能达到了上代K1的两倍,这也就意味着Tegra X1成为了当今市面上性能最强悍的移动处理器,下面请跟我们一起来看X1到底有多强,又强在哪里吧。
首先从英伟达的老本行GPU开始分析,早在GTC 2014的时候,英伟达就宣称下一代Tegra处理器将使用Maxwell架构的GPU,而Maxwell架构早就在桌面级的GPU上出现过了,而英伟达为了把这个架构放在移动处理器之上也是下了不少功夫,和Tegra K1的Kepler GPU不一样,X1上的Maxwell GPU可以算是从0开始全新设计的,而不是某个随随便便移植的作品。
当英伟达决定将移动处理器业务放在第一位的时候,这家公司的野心可见一斑,对于Tegra而言,高优先级的待遇意味着英伟达最新和最强的GPU都会以更快的速度登陆移动处理器——Maxwell 1的发布和Tegra X1的发布仅仅相隔了一年,相较于Kepler和K1两年的时间间隔确实短了很多。
此外,高优先级同样意味着英伟达将从架构底层上为移动处理器做出专属的功耗优化,而这一点不仅对于Tegra有利,对于桌面级的GPU的能耗降低也是有着显著作用的。
如此而来,Tegra X1就是英伟达这个策略下的第一个产物,这对于英伟达来说也是意义深远,得益于这样的产品策略,Tegra X1在已经非常强大的Tegra K1的基础上又获得了进化,而这些进化很多还是得益于使用了Maxwell架构。在CPU部分,英伟达决心要做市面上最强的CPU,所以英伟达也找上了ARM要来了A57架构(不过鉴于今后一段时间之内高端的CPU架构基本都会是A57,所以Tegra X1的最大武器依旧是那颗丧心病狂的GPU)。
进一步深入Tegra X1的GPU,我们所看见的是一颗为了Tegra而设计的Maxwell-2 GPU,相对于前作的Kepler,Maxwell 2架构加入了一系列的新功能,其中包括了第三代的多边形彩色压缩技术,每个CUDA核心的能效比也获得了提升,其他图形方面的功能还包括保守型光栅化算法、立体化覆盖资源和多帧抗锯齿等,这些听起来很酷的功能统统被塞进了Tegra X1之中。
在X1之中,英伟达对内存带宽和总体效率的改进在所有改进之中是最重要的,因为这两点基本就是移动处理器的瓶颈所在,在对于内存带宽的优化上,移动处理器厂家对于高端移动处理器的做法往往是对内存总线频率(Memory Bus)进行升级(升级到96位或者128位),这种简单粗暴的方法当然是效果最好并且最直观的,但是升级内存带宽就意味着升级成本和增加移动处理器以及周边设备的复杂度,在X1上,英伟达仍旧采用了64位的内存总线,于是为了不让性能强大的GPU饿着,英伟达加入了数据压缩,再配上LPDDR4的更新换代,X1的GPU效能才能获得全面发挥。
此外移动处理器的散热设计功耗(TDP)也是一个限制因素,对这方面进行改进的好处也是大大的:在降低处理器功耗的同时还能够提升性能,对发热进行控制也使得处理器在连续不断工作的时候表现更佳,这也就是为什么X1要使用台积电的20纳米工艺来对Maxwell的功耗进行优化。
最后但最重要的部分,就是X1还具有一个移动GPU专属的功能,而这个功能在桌面GPU上是没有出现的,而这个功能被英伟达称为“Double Speed FP16”,在加入这个功能之后,CUDA单元能够在FP16之下达成更高的性能,这在部分应用场景下是有用的。
和之前的Kepler和Fermi一样,Maxwell仅具有特定的FP32和FP64 CUDA核心,X1自然也不例外,在知晓了FP16的重要性之后,X1有着处理FP16任务独特的方式。在K1之上,FP16被简单地提升到FP32并调用FP32核心进行处理,而X1会将两个FP16包在一起变成一个单个的Vec2包,然后交由一个FP32 CUDA核心进行处理。
一言以蔽之,X1能够将同一个进程之中的两个FP16进行打包处理,打包之后,X1对于CUDA核心的利用就更加充分和灵活。
其实这也不是啥新奇的想法了,英伟达的竞争对手早就开始这么干了,总体来说这种处理方法依旧有点投机取巧的味道,ARM和Imagination在当下的GPU之中都具有FP16的兼容能力(要么就是有FP16处理单元或者更优良的ALU调配),而甚至AMD也要加入了,英伟达这么做也是情理之中。
但FP16的重要性又在哪里呢?这个其实说来话长,简单点说,FP16广泛地存在于Android的显示排序工作之中,因为对于Android来说这种低精度的计算对于省电是至关重要的;此外,FP16运算还在移动游戏领域有一定的地位,此外,FP16还存在于图像识别应用之中(比如英伟达自己的Drive PX平台)。
虽然FP16也有它自身的限制——16位对于现在的浮点数来说也确确实实不够了,不过在包括上方提到的应用之中,FP16依旧有着重要的发挥,由此对FP16快速准确的处理也显得重要起来了。
在功能性上就这么多了,剩下的就是用数据说话的时间。
总的来说,X1的GPU由两个Maxwell SMM塞进一个GPC组成,总的CUDA数量达到了256个,相比K1的单SMX直接翻倍,这也就意味着诸如几何和纹理单元这样的基础东西也加倍了,X1上能耗比更优的CUDA核心也使得Kepler望尘莫及。
除了CUDA核心数量之外,英伟达还对光栅ROP单元进行了修改,X1这回有了16个ROP,达到了K1的四倍,而这个ROP数量也赶上了GM107的ROP数量,这个提升对于X1支持4K@60Hz也是至关重要的,同时升级的带宽管理策略(效率和实际带宽均有)也保证了这些ROP在处理重型任务的时候不会饿着。
最后,我们还是不可避免地回到了谈论时钟频率和预期性能方面,英伟达官方暂时还没有公布X1的GPU频率,不过根据他们公布的性能数据来看,还是能猜出一点端倪的:英伟达宣称X1的FP16处理能力达到了1TFLOPs,由此推算,这颗GPU的最大频率可能已经达到了1GHz(1GHz×2FP16×2FMA×256=1TFLOPs)。
这个频率水平基本已经是桌面计算机级别的了,而这样的高频率对于一款移动处理器来说也已经是非常激进了,而对于X1最终将以什么形式落到消费者的手中依旧还是个未知数,目前唯一确定的就是搭载Tegra X1的设备肯定不会在短时间之内与我们见面(当然对于英伟达自家的产品就不一定了),这样的一颗核弹满速运转的时候,功耗和散热也会是一个无法回避的问题。
ViaAnandtech
更新:现场性能测试 byHardwarezone
3D Mark性能,得分达到43241分,为苹果A8X的两倍。
GFXBench跑分,帧数炸裂。
平均功耗图,作为对比的苹果A8X平均功耗为2.651瓦,X1的平均功耗为1.498瓦,这个功耗如果再控制一下,Tegra X1上手机还真不是不可能的。
英伟达 Tegra 处理器的市场接受度为何一代不如一代?
从Tegra2到现在的Tegra K1,市场接受度是越来越低,Tegra2当年可是摩托罗拉、LG、还有几家国产品牌力挺,Tegra3好歹有HTC One X和Nexus7采用了,Tegra4就明显没有国际大厂敢用到旗舰上了,小米也就是冒死只用在移动版上,Tegra K1到现在好像只有黄仁勋自己厂的游戏机准备用吧。有人来给分析分析原因吗?
------------------
网友烫走解答:
尝试回答一下这个问题,不一定绝对客观,但至少应该能给大家一个新的角度。
Mobile 对于 NVIDIA来说很重要。但是放眼望去市场竞争激烈。有冰雪聪明看准机会的高通,SoC 集成度高,在 ARM 架构和基带上积累多,几乎抓住了所有移动设备厂商最迫切的需求;有把 SoC 极度商品化的 MTK,TTM 短,市场细分好,跟车间似的一年好多款 SoC 顺便提供板级解决方案,让妈妈开了又开;还有高富帅Intel,高、富、帅。
黄仁勋一看,捏了捏肚子说还是打差异化吧,我们是视觉计算公司,感觉自己萌萌哒。要 disrupt the market,于是 2008 年 Tegra 诞生了。其实从那时起 Tegra 集成 NV 自己的 GPU 架构就是计划中的事情,因为只有这样才能 add value,利用好公司的强项。老黄更多地认为 mobile 同 PC 和 cloud 一样,也是计算平台,未来视觉计算会越来越重要。他看好 Androidgaming,相信 mobile is more than phones。
手上有张图:
Tegra 是 mobile platform 上的品牌(SHIELD 里面也是 Tegra)。再看高通这种以通信作为灵魂的公司,对 mobile 的理解和定位一定不是这个样子的。那做出来的 SoC 在手机上卖得比 Tegra 好,我觉得不是很正常么。
所以回答题主, NVIDIA 的强项在移动平台目前还没能得到很好的利用和展现,想通过 Tegra K1 逐步引导市场对于视觉计算的需求。但是手机作为移动设备中的一个重要成员,对基带的要求又很高。Tegra 实际正用自己的短板撬竞争对手的巨石。
当然短板肯定要补的。NVIDIA 在 2011 年收购了 Icera,一个做基带的公司,至于什么时候 NV 自己的基带成为标配就不清楚了。
相关问答
其他手机能运行 tegra 版的半条命 2 么?不能,tegra版是英伟达处理器专版,以后可能会出其他cup的版本不能,tegra版是英伟达处理器专版,以后可能会出其他cup的版本
索尼tabletp双屏平板怎么样?和之前的书卷式索尼tablets有异曲同工之妙。■屏幕:双屏,单个屏幕5.5寸(1024×480)■系统:Android3.2.1■CPU:NVIDIA_Tegra2双核■内存:2GB...
手机独显和gpu的区别?手机都是没有独立显卡的,独立显卡是给电脑使用的。独立显卡是指以独立板卡形式存在,可在具备显卡接口的主板上自由插拔的显卡。那么什么是手机GPU呢?由于近...
手机阿里巴巴是啥?是由阿里巴巴旗下子公司阿里云、国产手机商天语及芯片公司Nvidia(官方中文名称英伟达)三方共同打造。2012年4月,配备了4.3寸触摸屏,搭载了Tegra2双核处理器的...
ST-Ericsson Nova A9500是什么处理器?ST-EricssonNovaA9500是意法爱立信推出的移动处理器:工艺制程:45nm核心架构:Cortex-A9核心数:双核主频:1.2GHzGPU型号:Mali-400总体性能和联发科MT6...
阿里云手机用的什么系统-ZOL问答阿里云手机采用了NvidiaTegra2双核芯片,采用android2.2系统,这和阿里巴巴的总裁说的完全不一样。采用1GHz双核处理器。8G受内存加上512M手机缓存。这样的搭...
联想乐Pad K1是什么?联想乐PadK1依旧是圆滑的边角设计,10.1英寸屏幕支持1280times;800分辨率,配备NVIDIATegra2双核1GHz处理器。附带包装清单(白纸部分)、说明书(标号为1)、.....
ARM11和A8、A9最大区别是什么?A9/A8到底哪款好?A9和A8是近期很多板友比较关心的两款平板电脑主控芯片,前者是Cortex-A9内核,65nm制程,代表产品随芯随EM7C06;后者是Cortex-A8内核,45nm...
为什么现在的手机很少有用英伟达处理器的了?手机SOC行业和传统PC芯片行业不一样,英伟达的Tegra之所以手机市场接受度越来越低,主要原因在于三点:市场定位不准,基带技术不足,利润和成本的限制。Tegra的...T...
为什么死活安装不了MXPlayer播放器?1、MXplayer是安卓手机上最牛的播放器之一,安装很简单,下载apk一路安装完成,装的时候一定要注意,要装对应的版本。2、如果你的手机不太旧,直接装文件名里...