彭博社深入剖析DeepSeek

2025-03-03 11:02

凤凰网科技讯 北京时间1月27日,彭博社周一发文称,中国AI创业公司DeepSeek(深度求索)成立只有一年多时间,但它的AI模型已经取得了突破性进展,性能堪比世界上最出色的聊天机器人,成本却似乎远低于后者,这让美国硅谷感到震惊。

DeepSeek R1与OpenAI或Meta的模型相比如何?

虽然DeepSeek并未全面披露其R1新模型的细节,但该模型的训练和开发成本似乎仅为OpenAI或Meta最强产品的一小部分。R1的效率显然要高得多,这不禁让人质疑业界是否仍需要投入大量资金去购买英伟达等公司的最新、最强大的AI加速器。这也让外界更加关注美国针对中国的先进AI芯片出口管制,因为这些管制就是为了防止中国取得像DeepSeek这样的突破。

DeepSeek表示,R1模型在几个主要基准测试中的表现接近或超越了竞争对手的模型,例如测试数学能力的AIME 2024、测试常识的MMLU和测试问答性能的AlpacaEval 2.0。它还在加州大学伯克利分校研究生开发的AI系统排名网站Chatbot Arena上名列前茅。

DeepSeek何时引发了全球关注?

自从2023年发布最早模型以来,DeepSeek就一直备受关注。去年11月,它向世界预览了旨在模仿人类思维的DeepSeek R1推理模型,为其移动聊天机器人应用提供了技术支持。再加上网页版,该聊天机器人迅速成为全球知名的廉价OpenAI替代品。硅谷知名投资人马克·安德森(Marc Andreessen)称其为“AI的斯普特尼克时刻”(源自冷战时期的历史术语,现已成为一种隐喻,用来描述某个事件或时刻引发强烈的危机感或紧迫感,促使国家、组织或个人采取行动以应对竞争或挑战)。