本周,中国人工智能实验室DeepSeek的聊天机器人应用在苹果应用商店和谷歌应用商店的排行榜上名列第一,引起了广泛关注。DeepSeek的人工智能模型采用高效的计算技术进行训练,这使得华尔街分析师和技术专家开始质疑美国在人工智能竞赛中能否继续保持领先地位,以及对人工智能芯片的需求是否能够持续。

那么,DeepSeek究竟是从何而来的?它又是如何迅速获得国际声誉的呢?

DeepSeek的起源

DeepSeek得到了High-Flyer Capital Management的支持,这是一家中国量化对冲基金,利用人工智能来指导其交易决策。人工智能爱好者梁文峰于2015年与他人共同创立了High-Flyer。报道称,梁文峰在浙江大学读书时便开始涉足交易,2019年他创立了High-Flyer Capital Management,这是一家专注于开发和部署人工智能算法的对冲基金。

2023年,High-Flyer成立了DeepSeek,作为一家独立于金融业务的实验室,专注于研究人工智能工具。在High-Flyer成为其投资者之一后,该实验室分拆为独立公司,也被称为DeepSeek。

从一开始,DeepSeek就建立了自己的数据中心集群进行模型训练。然而,与中国其他人工智能公司一样,DeepSeek也受到美国硬件出口禁令的影响。为了训练其最新的模型,该公司被迫使用Nvidia H800芯片,这是美国公司可用的H100芯片的低功率版本。

据悉,DeepSeek的技术团队以年轻人为主,积极招募来自中国顶尖大学的博士级人工智能研究人员。此外,DeepSeek还聘请了没有计算机科学背景的人员,以帮助其技术更好地理解各种主题。

DeepSeek的强大模型

2023年11月,DeepSeek推出了其首组模型——DeepSeek Coder、DeepSeek LLM和DeepSeek Chat。然而,直到去年春天,这家初创公司发布了其下一代DeepSeek-V2系列模型,人工智能行业才开始关注它。

DeepSeek-V2是一款通用的文本和图像分析系统,在各种AI基准测试中表现优异,且运行成本远低于当时的同类模型。这迫使DeepSeek的国内竞争对手(包括字节跳动和阿里巴巴)降低部分模型的使用价格,甚至让其他模型完全免费。

DeepSeek-V3于2024年12月推出,进一步提升了DeepSeek的知名度。根据DeepSeek的内部基准测试,DeepSeek V3的表现优于可下载、公开可用的模型(如Meta的Llama)以及只能通过API访问的“封闭”模型(如OpenAI的GPT-4o)。

同样令人印象深刻的是DeepSeek的R1“推理”模型。DeepSeek于1月发布,声称R1在关键基准测试中的表现与OpenAI的o1模型相当。作为推理模型,R1能够有效地进行事实核查,帮助其避免一些常见的陷阱。与典型的非推理模型相比,推理模型通常需要更长的时间(通常多几秒到几分钟)才能得出解决方案,但在物理、科学和数学等领域往往更可靠。

然而,R1、DeepSeek V3及其他模型也存在缺点。作为中国开发的人工智能,它们需要接受中国互联网监管机构的基准测试,以确保其回应“体现社会主义核心价值观”。例如,在DeepSeek的聊天机器人应用中,R1不会回答有关天安门广场或台湾自治的问题。

颠覆性的方法

如果DeepSeek有商业模式,目前尚不清楚具体是什么。该公司的产品和服务定价远低于市场价值,并且还提供其他免费的产品和服务。DeepSeek表示,效率的突破使其能够保持极高的成本竞争力,但一些专家对该公司提供的数据提出了质疑。

无论如何,开发人员已经接受了DeepSeek的模型,这些模型并非传统意义上的开源模型,而是在允许商业使用的宽松许可下提供的。据托管DeepSeek模型的平台之一Hugging Face的首席执行官Clem Delangue称,Hugging Face上的开发人员已经创建了500多个R1的“衍生”模型,总下载量已达250万次。

DeepSeek在与规模更大、更成熟的竞争对手的较量中取得的成功被描述为“颠覆人工智能”和“被过度炒作”。该公司的成功至少在一定程度上导致Nvidia股价周一下跌18%,并引发了OpenAI首席执行官Sam Altman的公开回应。

微软宣布DeepSeek已在其Azure AI Foundry服务上推出,该平台将企业的AI服务整合到一个平台中。在第一季度财报电话会议上,当被问及DeepSeek对Meta的AI支出的影响时,首席执行官马克·扎克伯格表示,AI基础设施支出将继续成为Meta的“战略优势”。

与此同时,一些公司甚至禁止使用DeepSeek,整个国家和政府也是如此。纽约州还禁止在政府设备上使用DeepSeek。

至于DeepSeek的未来,目前尚不清楚。改进模型是必然的,但美国政府似乎越来越警惕其认为的有害外国影响。

作者 root

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注