NVDIA秋季GTC执行长黄仁勋的主题演讲才刚结束,隔日黄仁勋就举办一线上的媒体记者会,分享他对元宇宙的看法,以及未来在这方面的布局策略。
在记者会当中,许多人非常好奇,这次的秋季GTC是否所有都是虚拟打造?黄仁勋幽默的回答道,「所有的东西都是虚拟的,只有我是真的!」随即他又补充一句,「虚拟角色(Toy Jensen)也不是真的」。
至于被问到元宇宙何时会成真?黄仁勋则表示,元宇宙已经正在发生中。Omniverse就是一个可以帮助元宇宙建构不同的3D空间的平台,搭配数位分身的技术来模拟更种应用情境,如汽车、虚拟仓库、5G无线通讯布建等应用,甚至是未来更複杂的系统都能透过这些技术来实现。
其实NVIDIA也是这项技术的使用者之一。黄仁勋表示,NVIDIA早已将数位分身技术于自驾车的模拟、地图设计等应用。Omniverse不仅是模拟数位世界,同时还身兼串联不同世界的管道与平台,就如同网际网路一般,数位创造者可以互相合作,而这些都是现在正在发生的事情。
他提到,元宇宙的概念就像是网际网路的HTML页面,使用者可以透过网址、超连结穿梭在不同页面,同时也可以在不同页面上进行购物,只是它是以一个立体的方式呈现,所串接的空间更为广泛,所需要的资料与运算能力也就更为庞大。
不做应用平台,NVIDIA聚焦建构元宇宙基础
比起像是Meta(前身为Facebook)开发元宇宙的应用平台,黄仁勋表示,NVIDIA更聚焦在元宇宙运算的基础建设,帮全球各地的厂商、使用者建构一个虚拟世界。在这之中就需要许多人工智慧、模拟演算法、平台规划等技术,而这些都能在Omniverse上实现。
Omniverse内涵盖多种技术,例如Avatar帮助协助开发人员利用 Omniverse 打造能看、能说、能就各种主题进行对话,并能理解自然语意的互动式角色。Replicator,用于训练深度神经网路的合成资料引擎,以帮助开发人员创造出训练 AI 所需的大量资料。
此外,黄仁勋也特别强调用于训练大型语言模型的 Nemo Megatron这项技术。他表示,自然语言的生成是建构虚拟人物的一大挑战,若资料量不够就会影响到虚拟人物判读的障碍或準确度。若希望虚拟人物具备像人一样的「常识」(Common Sense),背后就需要有庞大的语言模型支撑,而「将会是史上最大的主流高效能运算(HPC)应用」。
黄仁勋分享,一套训练虚拟人物「常识」的方法。例如教会AI虚拟人物甚么是马,若用一般的照片说明,有可能AI看到斑马会觉得斑马就是马。但若是透过语言学习的方式,告诉AI斑马是身上黑白条纹的动物,就能让AI清楚辨识马与斑马的差异,即便AI没看过相关图片也能具备一般的常识。
自然语言理解是以 Megatron 530B 大型语言模型为基础,能够辨识、理解并生成人类语言。Megatron 530B 是一个经过预先训练的模型,可以在很少或没有训练的情况下完成句子、回答不同主题的大量问题、总结长篇且複杂的内容、翻译成其它语言,以及处理多个未经过专门训练的领域。
在元宇宙这个领域,黄仁勋将NVIDIA视为是创造元宇宙架构的推动者,以加速运算为核心,提供全方位(Full stack)的解决方案,搭配各种不同SDK的软体,让各种娱乐、健康产业、云端运算、自驾车等应用都能在单一平台上进行开发。