8月13日,接近DeepSeek人士向腾讯科技等媒体确认:此前盛传的R2大模型8月发布计划并不属实,公司本月内无任何发布安排。
——传闻起落:从“8月15日见”到紧急辟谣
上周起,多家科技媒体爆料称DeepSeek R2将在8月15-30日发布,甚至透露其采用华为昇腾910B芯片、支持多模态、性能对标GPT-5。消息一出,资本市场迅速反应:
◆寒武纪股价单日暴涨20%,AI概念股集体拉升;
◆开发者社区热议“国产模型新纪元”。
然而仅隔一天,DeepSeek内部人士向腾讯科技、澎湃新闻等紧急辟谣:“8月发布消息不实,无任何相关计划”。
这已是2025年内第二次“R2发布传闻”被官方否认——此前3月“3·17发布”消息同样遭辟谣。
——R2为何迟迟不发?两大关键原因浮出水面
1.CEO梁文锋对性能不满,坚持继续打磨
据《The Information》6月报道,尽管团队高强度开发数月,CEO梁文锋仍认为R2当前表现未达预期,尤其在复杂推理与多语言处理上需优化。
2.算力短缺,英伟达H20芯片遭禁售冲击
◆美国出口限制导致英伟达特供中国芯片H20供货中断;
◆DeepSeek担忧模型上线后用户激增致算力崩溃,影响体验。
8月11日DeepSeek全球服务宕机(用户量超1.1亿),疑似因R2测试流量激增触发保护机制。
为解决算力瓶颈,团队正尝试用华为昇腾910B集群(性能达NVIDIA A100的91%)训练R2,但规模化部署仍存挑战。
3.策略调整
DeepSeek近期重心是迭代现有模型(如R1-0528版本),而非仓促推新,失败的产品可能致命。
——不发R2≠躺平!DeepSeek近期动作频频
虽未发布新一代模型,DeepSeek却以“小步快跑”策略持续升级现有产品:
◆2024年3月:升级660B参数模型DeepSeek V3,强化编程与中文能力;
◆2025年5月:推出R1-0528版本,通过增加训练算力,将逻辑推理准确率提升25%(如AIME测试从70%→87.5%),“幻觉率”降低近50%;
◆8月13日:App新增“对话生成分享图”功能,提升用户体验。
——行业影响:国产大模型竞争白热化
◆国际压力:GPT-5已发布,Claude、Gemini紧追;
◆国内内卷:Hugging Face热榜前十中九款是国产模型,GLM-4.5、通义千问Qwen3等占据前列;
◆DeepSeek定位:其开源策略与低成本优势受开发者推崇,R1获HF社区1.25万点赞(国产最高),但技术迭代压力剧增。
🔍业内观点:“R2的延迟反映中国AI产业正从‘追速度’转向‘要质量’。”——资深AI分析师李明
——用户最关心什么?
◆何时能用到?内部人士透露“发布时间待定”,可能延至Q4。
◆比R1强在哪?预计支持多模态、更低推理成本,但具体参数仍保密。
◆会开源吗?R1已开源,R2大概率延续这一策略。
——等待,是为了更强的登场
尽管R2本月无缘面世,但其多模态、低推理成本(传比GPT-4 Turbo低97%)、国产算力自主化等突破仍被寄予厚望。
技术没有捷径,但蛰伏后的爆发更值得期待。
我们将持续关注R2动态——毕竟,好饭不怕晚,只怕不够香!