中国AI模型震惊硅谷 DeepSeek为何一夜火出圈?

内容摘要中国AI大模型震撼全球近日,中国AI公司DeepSeek发布的DeepSeek-R1大模型引起业界轰动。这款模型以更低的成本和更小的算力规模,を実現了媲美美国顶尖AI模型的性能,令业界刮目相看。据了解,DeepSeek已登顶中国和美国苹果A

中国AI大模型震撼全球

近日,中国AI公司DeepSeek发布的DeepSeek-R1大模型引起业界轰动。这款模型以更低的成本和更小的算力规模,を実現了媲美美国顶尖AI模型的性能,令业界刮目相看。

据了解,DeepSeek已登顶中国和美国苹果App Store应用商店,超过ChatGPT,让西方媒体惊叹“中国AI模型震惊硅谷”。

DeepSeek的优势

DeepSeek-R1大模型拥有以下优势:

  • 高性能:与OpenAI的O1模型不相上下,在数学、代码、自然语言推理等任务上表现出色。
  • 低成本:预训练费用仅为557.6万美元,不到OpenAI GPT-4o模型训练成本的十分之一。
  • 低运行成本:API定价远低于OpenAI o1。

对芯片产业的影响

DeepSeek的崛起引发了市场对芯片产业的影响。此前,OpenAI提出的“算力为王”理论认为,计算规模越大,模型越智能。这一理论推动了英伟达等芯片巨头的发展。

但DeepSeek的研究成果表明,通过软件架构和算法的创新,可以绕开算力限制,打造更高性能的AI大模型。这可能会打破芯片产业的格局。

需求爆火

DeepSeek的火爆出圈导致其应用曾出现宕机现象。公司回应称,这是由于用户访问量激增所致。

DeepSeek创始人回应

DeepSeek创始人梁文锋认为,中国AI不应该永远处于跟随地位,必须进行原创性探索。他呼吁建立一个类似西方国家的AI技术生态,为中国AI的发展提供支持。

 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
浙ICP备19001410号-1