全球即时看!英伟达CEO、OpenAI首席科学家访谈纪要:AI的今天与未来
我们也在优化方面做了一些工作,优化是一个瓶颈。研究生James Martens取得了突破,他提出了一种优化方法用二阶函数来实现。但重点是它证明了我们可以训练这些神经元。如果你能训练神经网络,你就把他变大一些,然后去找一些数据,你就会成功那么接下来的问题是,找什么样的数据?答案是ImageNet。当时ImageNet是一个难度很高的数据集,但若想训练一个大型卷积神经网络,在数据集上它必须成功。
神经网络所学习的,是产生文本的过程的一些表述。这些文本实际上是这个世界的一个映射,所以神经网络正在学习从世界越来越多的方面看待这个世界,看待人类和社会。神经网络学习一个压缩的、抽象的、可用的表述。这就是从准确预测下一个词的任务中学到的东西。此外,你对下一个词的预测越准确,还原度越高,在这个过程中你得到世界的分辨率就越高,这就是预训练阶段的作用,但这并不能让神经网络表现出我们希望它能够表现出的行为。
一个语言模型,它真正要做的是回答以下问题,如网上有一些随机的文本,以一些前缀开始,一些提示,它将如何完成?如果只是随机寻找一些片段填充,这和我想拥有一个助手是不同的,我想要的助手要诚实,要有帮助,要遵守一定的指导规则,这就是微调,这就是对来自于人类教师强化学习和其他形式的人工智能协助可以发挥作用的对方,不仅仅是向人类学习,也是人类和AI合作的强化学习。在这里我们不是在教授它,我们是在与它交流,希望它成为什么样。而这个过程,也就是第二阶段也是非常重要的。第二阶段做得越好,这个神经网络就越有用,越可靠。所以第二阶段是非常重要的,第一阶段,尽可能多地从世界的映射中学习,也就是文字。
(相关资料图)
AI的可靠性是由是否可以被信任决定的,未来肯定可以达到完全信赖的地步。如果它不明白,也会通过提问来问清楚,它会告诉你它不知道,但同时会向你询问更多的知识。我认为这是AI可用性影响最大的领域,未来会有最大的进步。
我们现在就面临一个挑战,比如让神经网络总结长的文档,获取摘要,挑战就是能确定重要的细节没被忽略吗?当他的总结可以达到所有人都认同的时候,我们就可以说它的内容是可靠的。对于内容护栏也一样,它是否清楚的遵循用户的意图也会成为衡量的标准。
___________________________________
在今年的 GTC 上,NVIDIA 创始人兼首席执行官黄仁勋与 OpenAI 联合创始人、首席科学家 Ilya Sutskever 进行了一场深度对话,讨论了 GPT-4、ChatGPT 背后的故事,也聊了下深度学习的未来。
如今,OpenAI 可以说是整个 AI 领域最火的研究机构。凭借强大的 GPT-4 以及与微软必应、Office 等产品的融合,这家公司似乎要掀起一场生产力革命。
这一成就是由多方面的力量来驱动的,包括聪明的头脑和强大的基础设施。
在「聪明的头脑」里,Ilya Sutskever 颇具代表性。2012 年,他和他的导师 Geoffrey Hinton 以及同学 Alex Krizhevsky 一起,用深度神经网络刷新了 ImageNet 的历史记录,拉开了卷积神经网络统治计算机视觉的序幕,标志着新一波人工智能浪潮的开始。2021 年,这个名为 AlexNet 的论文被引量突破 10 万。
「为了加速训练,我们用到了非饱和神经元和一个非常高效的 GPU 卷积操作实现。」Ilya Sutskever 等人在 AlexNet 的相关介绍中提到了这样一条关键信息。他们还详细说明了如何将他们的网络映射到多个 GPU 上。从这时起,GPU 和神经网络紧紧地绑定在一起。黄仁勋领导的英伟达自然也成了这波 AI 浪潮中不可或缺的一环。
2015 年,Ilya Sutskever 参与创办了 OpenAI,并带领这家公司一路向着 AI 大模型的方向前进。但随着模型变得越来越大,训练它们所需的算力也急剧增长。
「加速计算并非易事,2012 年,计算机视觉模型 AlexNet 动用了 GeForce GTX 580,每秒可处理 262 PetaFLOPS。该模型引发了 AI 技术的爆炸。十年之后,Transformer 出现了,GPT-3 动用了 323 ZettaFLOPS 的算力,是 AlexNet 的 100 万倍,创造了 ChatGPT 这个震惊全世界的 AI。崭新的计算平台出现了,AI 的 iPhone 时代已经来临。」黄仁勋在 GPT 大会的 Keynote 中说道。在这次大会上,英伟达发布了 ChatGPT 专用的 GPU,推理速度提升了 10 倍。
一路走来,Ilya Sutskever 和黄仁勋都是这波 AI 浪潮的见证者和重要推动者。在即将到来的「AI iPhone 时代」,两人也必将扮演重要的领导者角色。
在这场对话中,两人谈到了深度神经网络的能力、限制和内部工作方式,并勾勒了一些未来的图景。
在打造 GPT-4 的过程中,Ilya Sutskever 坚信「(模型)越大越好,扩大规模是 OpenAI 的目标之一」。这自然是黄仁勋喜闻乐见的。
I had a very strong belief that bigger is better, and a goal at OpenAI was to scale. ——Ilya Sutskever
两人的谈话进行了大约 1 个小时,就像老朋友边喝咖啡边聊天一样。以下是这次谈话的完整视频(带中文字幕),大家可以在其中感受时代的脉搏。
英伟达博客:网页链接 视频链接:网页链接
X 关闭
- 太阳能