18颗GPU相互连接,让整个系统的陡然性能超过难以置信的900Gb/s。现场加价“广告宣传”最后是整个系统的售价,黄仁勋现场回应展出用的这套实验产品实质上价值250万美元,然后再行释放出了一个150万美元的售价,在最后一秒必要自己“斧头到”了39.99万美元。
高举着两倍RAM的Quadro GV100加速器的黄仁勋值得一提的是,DGX-2中用于的虽然还是V100 GPU,但它再次发生了一点小变化——原先的4颗4GB HBM2RAM,升级为4颗8GB HBM2RAM,也让V100 GPU的整体RAM大小升级为32GB。(GPU其他参数,还包括RAM位宽、比特率皆没转变。
)而在DGX-2中,16个V100 GPU中各自享有的32GBRAM都将相连到一起,你甚至可以将它看作一整个512GB的RAM空间。那么到底这对于用户来说有多大的影响呢?英伟达官方的原话是:“RAM容量减少,让运营加深、更大的深度自学模型沦为有可能,同时也不会提高深度自学的展现出。对于内存大小较为脆弱的应用于,最多需要提高50%的实际展现出。
”黄仁勋:对于他这样的工程师来说,DGX-2太“sex”了充满著DGX-2的性能本身、充满著DGX-2在各种深度自学解决方案的性价比等等,英伟达在DGX-2上所采行的新策略也许更加有一点思维:分段架构先天享有杰出的扩展性,英伟达或许在传统的GPU架构、芯片制程之外寻找了一个延续性更加强劲的性能快速增长路线。当然从另外一个方面来讲,通过数量的变换,设备的性能的确可以快速增长,但如何构建数块GPU之间的大量数据陡然、同时确保这些新的加到的数据传输能力会导致太高的成本、以及更好的功耗,将不会是这一种路线的挑战。
高速、高效,让自动驾驶路测南北VR时代Drive Constellation的实际系统构成(右图)在众多的人工智能应用于当中,自动驾驶意味著是英伟达最忠诚的一个方向。在今年GTC大会的演说上,英伟达创始人兼任CEO黄仁勋又为自动驾驶行业带给了一个全新的解决方案——Drive Constellation。
Drive Constellation是一种用于虚拟现实(VR)技术的自动驾驶的模拟器,它让自动驾驶的开发者们在数据中心打造出一个虚拟世界,并对自动驾驶车辆的算法展开数十亿英里的测试。英伟达方面期望,通过自身强劲的图像图形和虚拟现实技术,让算法在虚拟环境中的测试无限相似于现实场景。在Drive Constellation中仿真夜间自动驾驶它的构成结构也非常简单,外观看起来就是两台DGX-1服务器。
不过两台服务器中的内容不过于一样:一台配备了数张英伟达的专业显示卡,另外一台则装有着和自动驾驶车辆完全相同的英伟达DRIVE PX平台。整个系统的工作方式也非常简单,配备了专业显示卡的服务器融合高清地图、车辆行经仿真算法、以及天气、光照等一系列条件,经由专业图形构成虚拟世界的驾驶员环境。
然后这些数据以类似于现实传感器的格式被必要发送到装载着Drive PX平台的服务器中,Drive PX平台根据这些数据,继续执行适当的自动驾驶算法,并且最后将车辆的操控输入回到到虚拟化的服务器中,构成循环。根据英伟达官方的解释,两台服务器在1秒的时间内可以展开30次这样的循环。英伟达还回应,这套系统需要仿真有所不同的天气,如暴风雨雪天气、一天中有所不同时刻致盲的炫光、夜晚受限的视野以及有所不同类型的路况和地形。同时,它也可以仿真危险性的路况以测试自动驾驶汽车的反应能力。
然后开发者可以对自动驾驶的算法展开改良和完备。英伟达汽车部门高级主管Danny Shapiro回应回应:“这对于行业来说是一个十分有价值的工具,它需要加快自动驾驶的研发进程。
”黄仁勋在演说中也说道了一个数字:10000套Drive Constellation系统,一年就需要路测30亿英里。据理解,Drive Constellation将在今年第三季度推向市场,并为英伟达的早期客户获取服务。在英伟达的生态系统中,目前早已汇聚了多达370个有所不同的公司。
大家将合力研发自动驾驶技术。虽然这个数字体现了英伟达阵营的可观,但这个生态中的 370 个合作伙伴并不都是汽车厂商。具体来说,这些合作伙伴还包括乘用车,卡车、物流车和自动驾驶出租车等,一级供应商,自动驾驶初创公司、激光雷达公司、地图公司等等。通过这套虚拟现实的驾驶员模拟器,英伟达几乎可以将数量众多的合作伙伴放在一个平台当中,加快自动驾驶技术研发、落地的进程,反过来稳固英伟达自身硬件在自动驾驶领域的不能替代性。
持续渗入的TensorRT,大大加快的AI版图TensorRT也是一项英伟达去年公布的新技术,它的目标是将各种人工智能架构的算法,与英伟达各种架构的GPU互为兼容,通过二次优化算法提高整体算法在英伟达GPU上面运营的效率。而在本次GTC之上,英伟达也拿走了近期版本的TensorRT 4,它最重要的特点就是更高的效率,根据英伟达官方的测试在多种人工智能算法在同一个服务器上运营的时候,TensorRT 4需要增加70%的硬件市场需求,同时还能在延后方面提高190倍。
归功于软硬件的提高,英伟达在AlexNet的训练速度上5年间提高了500倍比起性能方面的提高,此次TensorRT在业界反对方面的新进展只不过更为有一点注目。因为在去年TensorRT或许上早已是一个英伟达自己的人工智能架构,而且是凌驾于完全所有人工智能架构的终极架构。
这对于之前期望通过培育人工架构、打造出权利人工智能生态的公司来说并不是好事。令人惊艳的是,英伟达官方回应早已和Google达成协议合作,将在近期的TensorFlow 1.7版本中必要嵌入TensorRT,进而更进一步强化TensorFlow架构在GPU中的展现出。Goolge的工程总监Rajat Monga还尤其回应,Google的TensorFlow团队仍然和英伟达维持着密切的合作关系。
其他“一部分”重点内容:光线跟踪、医疗平台、自家GPU云技术、自动驾驶路线图、远程VR驾驶员英伟达RTX技术RTX技术是目前市面上最强劲的光线跟踪技术,可以对多种材质展开最相似现实的动态图形,现场展示中还包括了比较复杂的动态场景。医疗平台Clara由人工智能驱动的医疗平台Clara是英伟达的一次全新尝试,现场的展出中,英伟达通过对一个二维的超声波观测动态结果展开处置,必要精准还原成患者体内脏器的活动,甚至可以必要算数出有心脏的容积、以及每次跳动的体积差异。未来自动驾驶平台路线图Roadmap是半导体厂商少见的一种产品规划手段,最有名的要数Intel早已过热的“Tick-Tock”。在本次GTC上,黄仁勋也共享了英伟达DRIVE系列产品的RoadMap策略——小尺寸的单芯片平台,然后通过芯片数量和GPU的加到取得更加强劲的性能,然后利用技术将更加强劲的性能再度传输为小尺寸的单芯片平台,一次以此类推。
现场透漏下一代单芯片平台代号为Orin。基于Holodeck的远程虚拟世界驾驶员系统想用VR来做到远程驾驶员的初创公司有可能很瓦解。总结:GPU的动力依旧强大,英伟达不只是一家“性能驱动公司”总结完了现场的主要内容,大自然也是时候再行鼓吹过头来看上文开篇的问题了。
首先被迫托的就是人们对于GPU的期望,虽然在前几年的历程中,英伟达完全源源不断地拿走改版、更加强劲的GPU芯片。但它注定也是半导体的芯片,某种程度不会受到制程的物理容许,单颗芯片的提高可玩性还将大大提高。
但因为分段运算的原因,GPU实质上很更容易展开纵向的扩展,此次GTC上公布的全新16颗V100 GPU的DGX-2加速器就是最差的证明。在利用适合的数据传输技术的前提下,GPU未来的动力快速增长依旧会“很强大”。另外一个要点实质上是英伟达在硬件之外所做到的诸多工作,从针对各种人工智能架构、算法的持续优化,到几乎VR简化的自动驾驶路测,英伟达实质上在大大为整个生态赋能,铲除一些关键性的障碍。这种能力,共创人工智能、自动驾驶这样的领域,都是无人超群的。
毫无疑问,在2018接下来的日子里,教主和他的英伟达,还将给我们带给更加多惊艳。原创文章,予以许可禁令刊登。下文闻刊登须知。
本文来源:pg问鼎娱乐-www.qzyangsj.cn