人工智能搜索公司 Perplexity 通常会让用户在其网站上体验最先进的大型语言模型,但该公司迅速采取行动,将中国公司 DeepSeek 的新 R1 模型放在用户界面的显著位置。这一举措为用户提供了了解热门话题的机会,而无需向在中国托管的 DeepSeek 应用程序发送数据。

尽管一些人工智能领域的意见领袖,例如 Thrive Capital 的 Josh Kushner、Scale AI 的 Alexander Wang 和 Anduril 的 Palmer Luckey,对于 DeepSeek 所取得的成就持怀疑态度,Perplexity 的首席执行官 Aravind Srinivas 却对此模型的独特性表示认可。他在周二的一封订阅电子邮件中写道:“过去几年,人工智能领域经历了几次革命性的时刻,改变了整个格局。我深信,这又是一个革命性时刻。”

目前,Perplexity 的免费版和付费版用户都可以通过搜索栏中的菜单按钮选择使用 DeepSeek 模型(用户同样可以选择 OpenAI 的 o3 mini 模型)。Perplexity 首席商务官 Dmitry Shevelenko 指出:“它是核心模型之一。最令人兴奋的是,我们还开发了一个用户界面……用户能够实时看到模型的思维链,这在以前是无法实现的。”

由于 DeepSeek 在中国的监管框架下运营,该公司必须限制其模型讨论政治敏感话题,例如天安门广场抗议。然而,Perplexity 能够从 DeepSeek-R1 的开源版本中移除这些限制。

Perplexity 还表示,用户与聊天机器人共享的任何数据都会保留在其位于美国和加拿大的服务器上,不会与 DeepSeek 或中国方面共享任何数据。

在 Perplexity 提供的模型中,DeepSeek R1 的独特之处在于它展示了法学硕士得出答案所遵循的“思路链”。DeepSeek 的研究人员在模型的开发中进行了一些创新,主要是出于节省计算能力的考虑。该公司表示,在美国芯片禁令切断对 Nvidia 最强大 GPU 的使用后,他们转而使用性能较弱的 Nvidia H800 芯片来训练其模型。最终的结果是创造出一个展示最先进智能的模型,同时所需的计算能力远低于同类产品。

对于 Perplexity 来说,这无疑是一个好消息。Shevelenko 表示:“效率很高。我认为我们还无法确切知道推理成本的细节,但如果模型是开源的,您就不需要向私人模型提供商支付费用,这本身就是一项巨大的效率提升。”

作者 root

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注