由于现有方法的局限性,OpenAI及其竞争对手正在寻求更智能的人工智能新途径

2025-08-26 06:06来源:本站

  

  (路透社)-像OpenAI这样的人工智能公司正在寻求通过开发训练技术来克服在追求更大的大型语言模型时意想不到的延迟和挑战,这些技术使用更像人类的方法来让算法“思考”。

  十几位人工智能科学家、研究人员和投资者告诉路透社,他们认为OpenAI最近发布的o1模型背后的这些技术可能会重塑人工智能军备竞赛,并对人工智能公司永不满足的资源类型(从能源到芯片类型)产生影响。

  OpenAI拒绝对本文发表评论。两年前,风靡全球的聊天机器人ChatGPT发布后,估值从人工智能热潮中受益匪浅的科技公司公开表示,通过增加更多数据和计算能力来“扩大”当前模型,将持续改进人工智能模型。

  但现在,一些最杰出的人工智能科学家正在公开指出这种“越大越好”哲学的局限性。

  人工智能实验室Safe Superintelligence (SSI)和OpenAI的联合创始人Ilya Sutskever最近告诉路透社,扩大预训练(训练人工智能模型的阶段,该模型使用大量未标记的数据来理解语言模式和结构)的结果已经停滞不前。

  Sutskever被广泛认为是通过在预训练中使用更多数据和计算能力来实现生成式人工智能进步的早期倡导者,这最终创造了ChatGPT。今年早些时候,Sutskever离开OpenAI成立了SSI。

  “2010年代是规模扩张的时代,现在我们又回到了奇迹和发现的时代。每个人都在寻找下一个东西,”Sutskever说。“现在比以往任何时候都更重要。”

  Sutskever拒绝透露他的团队如何解决这个问题的更多细节,只是说SSI正在研究一种扩大预训练规模的替代方法。

  据三位知情人士透露,在幕后,主要人工智能实验室的研究人员在发布一种大型语言模型的竞赛中遇到了拖延和令人失望的结果,该模型的性能要优于OpenAI的GPT-4模型,后者已经推出了近两年。

  大型模型的所谓“训练运行”可能需要花费数千万美元,同时运行数百个芯片。考虑到系统的复杂性,它们更有可能出现硬件导致的故障;在测试结束之前,研究人员可能无法知道这些模型的最终性能,这可能需要几个月的时间。

  另一个问题是,大型语言模型吞噬了大量数据,而人工智能模型已经耗尽了世界上所有容易获取的数据。电力短缺也阻碍了训练运行,因为这个过程需要大量的能源。

  为了克服这些挑战,研究人员正在探索“测试时间计算”,这是一种在所谓的“推理”阶段或模型被使用时增强现有人工智能模型的技术。例如,一个模型可以实时生成和评估多种可能性,而不是立即选择一个答案,最终选择最佳的前进路径。

  这种方法允许模型将更多的处理能力用于具有挑战性的任务,如数学或编码问题或需要类似人类推理和决策的复杂操作。

  OpenAI的研究员诺姆?布朗(Noam Brown)上个月在旧金山举行的TED人工智能大会上表示:“事实证明,让一个机器人在一盘扑克牌中思考20秒,与将模型放大10万倍、训练10万倍的效果相同。”

  OpenAI在其新发布的名为“01”的模型中采用了这种技术,该模型以前被称为Q*和草莓,路透社在7月份首次报道了这一技术。O1模型可以以多步骤的方式“思考”问题,类似于人类的推理。它还涉及使用来自博士和行业专家的数据和反馈。o1系列的秘密武器是在GPT-4等“基础”模型之上进行的另一套训练,该公司表示,它计划将这种技术应用于更多、更大的基础模型。

  与此同时,据五名知情人士透露,来自Anthropic、xAI和谷歌深度思维(Google DeepMind)等其他顶级人工智能实验室的研究人员也一直在努力开发自己版本的人工智能技术。

  OpenAI首席产品官凯文·威尔(Kevin Weil)在10月份的一次科技会议上表示:“我们看到了很多唾手可得的成果,我们可以很快地把它们摘下来,让这些模型变得更好。”“等到人们迎头赶上的时候,我们会努力领先三步。”

  谷歌和xAI没有回应置评请求,Anthropic也没有立即置评。

  这可能会改变人工智能硬件的竞争格局,到目前为止,市场对英伟达人工智能芯片的需求一直处于主导地位。从红杉资本(Sequoia)到安德森·霍洛维茨(Andreessen Horowitz)等知名风险投资机构都注意到了这一转变,并在权衡其昂贵赌注的影响。这些机构已投入数十亿美元,为OpenAI和xAI等多个人工智能实验室的人工智能模型开发提供资金。

  红杉资本(Sequoia Capital)合伙人黄索尼娅(Sonya Huang)对路透社表示:“这种转变将把我们从大规模预训练集群的世界推向推理云,这是一种分布式的、基于云的推理服务器。”

  对英伟达最先进的人工智能芯片的需求,推动该公司在10月份超越苹果,成为全球市值最高的公司。与英伟达主导的训练芯片不同,这家芯片巨头可能在推理市场面临更多竞争。

  当被问及对其产品需求可能产生的影响时,英伟达指出,该公司最近在演示中提到了o1模型背后技术的重要性。该公司首席执行官黄仁勋(Jensen Huang)曾谈到,使用其芯片进行推理的需求正在增加。

  “我们现在已经发现了第二个缩放定律,这是推理时的缩放定律……所有这些因素导致对Blackwell的需求非常高,”黄在上个月印度的一次会议上说,他指的是该公司最新的人工智能芯片。

  (Krystal Hu纽约报道,Anna Tong旧金山报道;编辑:Kenneth Li和Claudia Parsons)

  ×

一物网声明:未经许可,不得转载。