中国AI大模型震撼全球
近日,中国AI公司DeepSeek发布的DeepSeek-R1大模型引起业界轰动。这款模型以更低的成本和更小的算力规模,を実現了媲美美国顶尖AI模型的性能,令业界刮目相看。
据了解,DeepSeek已登顶中国和美国苹果App Store应用商店,超过ChatGPT,让西方媒体惊叹“中国AI模型震惊硅谷”。
DeepSeek的优势
DeepSeek-R1大模型拥有以下优势:
- 高性能:与OpenAI的O1模型不相上下,在数学、代码、自然语言推理等任务上表现出色。
- 低成本:预训练费用仅为557.6万美元,不到OpenAI GPT-4o模型训练成本的十分之一。
- 低运行成本:API定价远低于OpenAI o1。
对芯片产业的影响
DeepSeek的崛起引发了市场对芯片产业的影响。此前,OpenAI提出的“算力为王”理论认为,计算规模越大,模型越智能。这一理论推动了英伟达等芯片巨头的发展。
但DeepSeek的研究成果表明,通过软件架构和算法的创新,可以绕开算力限制,打造更高性能的AI大模型。这可能会打破芯片产业的格局。
需求爆火
DeepSeek的火爆出圈导致其应用曾出现宕机现象。公司回应称,这是由于用户访问量激增所致。
DeepSeek创始人回应
DeepSeek创始人梁文锋认为,中国AI不应该永远处于跟随地位,必须进行原创性探索。他呼吁建立一个类似西方国家的AI技术生态,为中国AI的发展提供支持。
0 条