黄仁勋:我们已经到达了生成式AI的引爆点

撰文 | 雁   秋

编辑 | 李信马

题图 | 演讲视频截图

“我们离倒闭永远只有30天。”这是英伟达首席执行官黄仁勋的口头禅。 

结束了几天前台湾大学的毕业典礼,5月29日上午,黄仁勋再次身着标志性皮衣,现身于中国台北的国际电脑展Computex 2023活动现场,并发表主题演讲。黄仁勋向全世界宣布,“我们已经到达了生成式AI的引爆点。从此,全世界的每个角落,都会有计算需求。” 

发布会上,英伟达公布了一批与AI相关的新产品和服务,包括为游戏提供定制AI模型代工服务“ACE for Games”,以及被黄仁勋称作“巨型GPU”的GH200芯片。

01.“ACE for Games”

活动现场上,黄仁勋展示了英伟达在游戏业的新进展:一间具有赛博朋克感的拉面店,和里面恍若真人的拉面店老板。

在视频中,拉面店老板Jin可以即时与玩家kai进行语音对答,并对玩家相应要求做出下一步指令,而两者之间的对话也基本做到了合乎逻辑。 

图源:演讲视频截图

比如说,Jin对着玩家抱怨拉面店附近的犯罪活动影响到了他的生意,并在玩家询问是否能提供帮助时,Jin准确回答出罪犯首领Kumon Aoki,并指引玩家前往地下搏击馆寻找游戏Boss。

据介绍,这是英伟达推出的用于游戏中人物模型开发的“ACE for Games”服务(ACE:Avatar Cloud Engine)。借助大语言模型,游戏中对NPC输入背景故事等必要资料,NPC即可实时与玩家产生互动,产生符合逻辑的语言对话、表情等,增强游戏沉浸感。

“这就是未来游戏的样子。”黄仁勋说道。

目前公开的这一演示是由英伟达和其合作伙伴Convai构建,基于一套名为Nvidia ACE的插件,可以在本地和云端游戏中运行。整个ACE套件包括英伟达的大型语言模型NeMo工具,Riva语言转文本和文本转语音工具等。 

图源:演讲视频截图

此外,英伟达还称大部分系统都将在云端运行,这意味着玩家并不需要额外的显卡来运行ACE,因为大多数AI操作都不会在玩家的电脑上完成。 

但需要明确的一点是,英伟达仅是提供一个代工工具,提供一个插件即能实现互动交流的功能,最终还是要看游戏开发者们如何使用这一工具。

“我们得帮助产业利用到大模型,”黄仁勋在演讲中称,“大模型的普及仍然不够,企业需要为特定的业务使用定制大模型。” 

02.巨型GPU:GH200芯片 

此次活动,最引人注目的是英伟达Grace Hopper 超级芯片已经全面投产。这些芯片是英伟达新推出的 DGX GH200 人工智能超级计算平台和 MGX 系统的核心组件,它们专为处理海量的生成型人工智能任务而设计。 

据了解, Grace Hopper 超级芯片是英伟达开发的基于 Arm 架构的 CPU+GPU 集成方案,内置共计超过2000亿个晶体管,配备96GB HBM高速显存以及576GB显存,在系统内可提供高达900GB/s的总数据吞吐速度(带宽),是当前行业标准PCIe Gen5接口速度的7倍,可以为某些内存受限的工作负载提供了巨大的优势。 

图源:演讲视频截图 

针对企业,黄仁勋还宣布推出大内存AI超级计算机DGX GH200。

DGX GH200是为了给客户们提供最大的吞吐量和可扩展性而设计的。通过使用英伟达定制的NVLink Switch芯片,绕开InfiniBand和以太网等标准集群连接的局限性,为最大工作负载的大规模可扩展性提供最大的吞吐量。

具体来看,DGX GH200超级计算机集成最多达256个GH200芯片,配备多达144TB的共享内存,约为DGX A100超算320GB内存的500倍,可让开发者更好地开发聊天机器人、互联网推荐系统算法等大模型AI应用。

黄仁勋表示:

GH200 芯片为“巨型 GPU”。这是英伟达第一次使用 NVLink Switch 拓扑结构来构建整个超级计算机集群,提升了数倍GPU通道带宽。该系统拥有150 英里(约 241.4 公里)的光纤,并且重达 4 万磅,但是呈现出来的外表就像是一个单独的GPU单元。

据悉,英伟达将把 DGX GH200 的参考蓝图提供给其主要客户谷歌、Meta 和微软,并且还将把该系统作为云服务提供商和超大规模数据中心的参考架构设计。 

图源:演讲视频截图

与此同时,英伟达还推出了NVIDIA MGXTM,一个供系统制造商快速、低成本地构建100多个服务器变体的参考架构。

据悉,这个规范可以将开发成本削减多达四分之三,并将开发时间缩短三分之二,仅需要6个月。有了MGX,科技公司可以为他们的服务器优化加速计算的基本系统架构,然后选择自己的GPU,DPU和CPU。 

此外,英伟达宣布还将与全球最大的广告传播集团WPP合作,运用人工智能和元宇宙大幅降低广告的制作成本。黄仁勋称,他们正与WPP开发一款利用NVIDIA Omniverse和人工智能的内容引擎,以更快、更高效、更规模化的方式帮助创意团队制作高质量的商业内容,同时完全与客户的品牌内核保持一致。 

可以预见,英伟达或将为未来的广告业带来“颠覆式”革新。 

图源:3月GTC大会截图

30岁创业,掌舵英伟达27年,熬退了老对手英特尔四任CEO,黄仁勋在芯片领域中始终没有停下脚步。或许正因如此,他才会在中国台湾大学毕业典礼上讲出这番话: 

“你不是为了食物而奔跑,就是为了避免成为食物而奔跑。往往你无法分辨到底是哪种情况。不管怎样,都要奔跑。”

如今,从游戏、数据中心、云、半导体、加密货币再到最近ChatGPT,几乎所有风口的背后都有英伟达的影子。尤其是面对目前最热的人工智能领域,黄仁勋更是称“公司和个人应该熟悉并了解人工智能(AI)的新浪潮,否则可能会被‘淘汰’。” 

这话乍一听有点“横”,不过黄仁勋确实有这样的底气。

如今ChatGPT掀起了AI热潮,背后都要靠千万个GPU夜以继日地计算,而这些GPU中大部分都是英伟达的产品。黄仁勋曾透露,在2016年,正是他本人向OpenAI亲手交付了第一台DGX超级计算机,此后成为ChatGPT背后大型语言模型的引擎。

作为AI淘金潮中的“卖水工”,根据英伟达最新财报,截至2023年4月30日,公司在一季度营收71.92亿美元,虽然同比下降13%,但相比上一季度增长了19%,且远高于预期的65.2亿美元;净利润20.43亿美元,同比增长26%,较上一季度增长44%。 

图源:英伟达官方财报 

黄仁勋表示,销售额增长主要是由于市场对数据中心产品的“需求激增”。近期的人工智能热潮,OpenAI的ChatGPT等语言生成式工具和其他人工智能应用的崛起正在推动对计算能力的需求,企业争相使用英伟达的芯片来训练和部署类ChatGPT等生成式AI应用程序。

由于业绩高于市场预期,加之英伟达预计二季度销售额110亿美元,同比增长64%,财报发布后的盘后交易中,英伟达股价大涨24.63%,逼近历史最高点,市值则暴涨1800亿美元,可谓是一晚上涨出了一个AMD(市值1750亿美元)。如今英伟达总市值也直逼万亿美元大关,黄仁勋的身价暴涨至330亿美元以上。 

高盛分析师Toshiya Hari在一份报告中写道:“鉴于英伟达的竞争优势,以及客户开发和部署日益复杂的AI模型的紧迫性,我们预计,在可预见的未来,英伟达将保持其行业龙头的地位。”

英伟达和黄仁勋的传奇还将继续。

热门相关:峡谷正能量   重生当学神,又又又考第一了!   梦回大明春   特工重生:快穿全能女神   最强反套路系统