梁文锋等来及时雨

当一众大模型玩家都在比拼模型更新和产品体验之际,迟迟没有大动作的『DeepSeek』,不出意外迎来了自身流量和产品使用率的下滑。

『DeepSeek』自1月以来的爆发式增长,仅持续了2个月时间。从4月份开始,『DeepSeek』月活跃用户数便掉头向下。QuestMobile数据显示,截至5月份,『DeepSeek』月活跃用户规模为1.69亿,环比下滑5.1%。

随着月活用户规模下降,『DeepSeek』的下载量排名也急速下坠。曾经一度在中美两地的苹果App Store 免费应用下载榜上夺冠的『DeepSeek』,如今已经被挤到了30名开外。

来自SemiAnalysis『半导体』研究机构的一份报告,更是直观展现了『DeepSeek』在用户使用率方面的下降态势——从年初7.5%的峰值,回落至5月底的3%,官网访问量也同期下降了29%。

梁文锋并非没有准备。早在2月份,路透社就曾爆料,『DeepSeek』内部正在加速推出R2模型,该模型原计划在5月初发布,但现在官方希望能尽早发布。

但直到7月中旬,R2模型仍迟迟未见。The Information曾爆料称,阻挡R2模型上线的一大原因是,『英伟达』H20『芯片』的意外禁售,使得『DeepSeek』在算力储备上出现紧缺状况。梁文锋担心新模型一旦上线,会因为短时间内调用量过高而造成体验不佳。

年初R1模型爆火后,梁文锋的低成本大模型训练方法,还意外带火了H20『芯片』在国内的需求。

今日霍州(www.jrhz.info)©️

自2023年以来,H20『芯片』是『英伟达』可合法出口至中国的最强AI『芯片』。但在『DeepSeek』影响之下,4月份,美国对其实施新的出口管制许可,其被禁止卖入中国市场。

如今,上述禁令终于迎来转机。7月15日,在黄仁勋年内第三次访华之际,『英伟达』官方公告,公司正在提交重新销售H20『芯片』的申请,且美国政府已向『英伟达』保证将授予许可证,接下来,公司将尽快启动交付程序。

面对被同行抢跑的竞争格局,高端算力遇阻的梁文锋,意外等来了黄仁勋送来的一场及时雨。

jrhz.info

A

R1发布近半年来,动作寥寥的『DeepSeek』,不可避免陷入不进则退的现实困境之中。

在国内其他大模型玩家卯足劲头追平乃至超过『DeepSeek』模型性能之际,梁文锋只是带领团队出着一些小招式,如『DeepSeek』 V3模型完成小版本升级,上线新版本『DeepSeek』-V3-0324,随后又更新了以『DeepSeek』-V3为基础模型微调而来的『DeepSeek』-Prover-V2——一款数学定理证明模型。

最近的一次动作还要数5月底完成的『DeepSeek』 R1小版本升级。但值得注意的是,『DeepSeek』-R1-0528仍然使用的是2024年12月所发布的『DeepSeek』 V3 base模型微调而来,并非基于新一代的V4模型。

今日霍州(www.jrhz.info)©️

官方介绍中,『DeepSeek』-R1-0528更多是在后训练过程中投入了更多算力,以此来提升模型的思维深度与推理能力,其在数学、编程等方面的整体表现,逼近OpenAI o3与谷歌 Gemini-2.5-Pro等国际顶尖模型。

但缺乏大版本升级,只是在小版本上修修补补的『DeepSeek』,遭遇的直观后果之一便是,外界给其贴上的性价比标签,正在一点点被重新撕下

一贯以性价比开道的『DeepSeek』,在过去近半年内,正在被阿里、字节、百度等科技大厂夺走自身的性价比标签,科技大厂纷纷推出了API价格更低的同类模型。

百度创始人李彦宏更是贴脸开大,吐槽『DeepSeek』除了没有多模态之外,使用起来还慢且贵,“中国市场上绝大多数的大模型API调用价格都比『DeepSeek』满血版要低,而且速度也更快。”

现在,蓄足实力的“AI六小龙”们,通过新的模型更新,也开始在性能和价格上纷纷挑战起『DeepSeek』的性价比。

7月份新上线的Kimi K2模型,同样选择了开源,并成为国内开源领域首个总参数量达到1万亿的MoE架构基础模型。

官方介绍,在SWE Bench Verified、Tau2、AceBench等一系列基准性能测试中,Kimi K2 均取得开源模型中的SOTA成绩,在『DeepSeek』擅长的代码、数学推理任务上实现了反超。

价格上,Kimi K2每百万输入tokens收费4元,每百万输出tokens收费16元,对齐了『DeepSeek』在标准时段(8点半到夜间12点半)的API价格体系。

Kimi之外,6月中旬更新的MiniMax-M1模型,号称世界上第一个开源的大规模混合架构推理模型,其号称整个强化学习阶段只用到512块H800三周的时间,租赁成本只有53.47万美金。对比『DeepSeek』,其V3模型训练是在2048块H800上实现的,总花费约为557万美元💵。

B

摸着『DeepSeek』过河的一众国产大模型玩家,纷纷在模型性价比上完成了抢跑。对比国外的OpenAI,尽管各家也都在推出各类平替模型,但OpenAI的总调用量依然保持稳定的秘诀,主要在于其在基础模型能力上依然保持着行业头部的水平,始终领先着竞争对手将近一代的差距。

相比之下,『DeepSeek』爆火出圈的R1,也只是做到了比肩o1的水平,而非彻底超越OpenAI的存在。所以,这也能部分解释为什么短短半年内,『DeepSeek』官方应用和管网流量就相继迎来了下跌,而ChatGPT却依然维持稳定增长。

不过,需要注意的是,尽管『DeepSeek』自身流量在下滑,但在第三方平台,R1和V3模型的总使用量仍在持续快速增长。SemiAnalysis给出的数据显示,第三方平台托管的 R1 与 V3 使用量,自R1发布以来已增长近 20 倍。

之所以会造成上述反差局面,SemiAnalysis认为『DeepSeek』更多是败在了Token经济学上。

今日霍州(www.jrhz.info)©️

虽然外界一般都以每百万 tokens的价格来衡量各个模型的性价比,但这一方法并不总是有效或合理,“因为这忽略了具体工作负载和用户需求。”SemiAnalysis分析师指出。

包括延迟(模型生成首个 token 所需时间)、吞吐率(每个token的生成速度)、上下文窗口等因素的差异,都会对最终的token消耗成本产生直接影响。

典型如 『DeepSeek』 为了在推理资源有限的情况下提供便宜模型,其上下文窗口严格控制在了64K,是一众主要模型提供商中最小的之一。

与之对比,近期更新的Kimi K2,支持最长128K上下文。更早之前更新的MiniMax-M1,更是支持业内最高的100万上下文输入,是『DeepSeek』 R1的8倍。

当然,这更多是 『DeepSeek』主动选择的结果。在一众大模型玩家中,梁文锋不仅主动选择了开源,且还直接表现出了对C端应用毫不在意的商业考量。追求并实现AGI,才是梁文锋视野中的头等大事。

C

但『DeepSeek』终究不是一家慈善机构,梁文锋尽管追求模型开源,他最终想要的也是借助开源生态实现预期的商业化。

基于此,维持开发者群体的活跃,和自家产品的用户使用率,不仅必要,而且对大模型玩家来说更是多多益善。

如何重新激活外界对『DeepSeek』的兴趣,最直接的解决办法,无疑便是尽快推出新模型V4和R2。

这方面,奥特曼已经为梁文锋做了最佳现身说法。在『DeepSeek』抢走行业热度后,奥特曼几乎以每周都有新产品的更新频率,让OpenAI牢牢定在了AI热搜榜上:在模型侧推出了GPT 4.5、o3-mini/o4、GPT 4.1;在产品侧上线了Operator、Deep Research、Codex;在体验侧,学习『DeepSeek』开放思维链,并主导了吉卜力风格图片的流行。

上述动作背后,都藏着奥特曼对OpenAI模型调用度规模的追求。全球最大的大模型整合应用平台Poe,在此前发布的《2025年春季人工智能模型使用趋势》报告中指出,OpenAI的GPT-4.1系列发布后几周内,份额迅速增加到了约10%,位列第一。对比『DeepSeek』,其R1模型使用率,已从2月中旬的峰值7%下降到了4月底的3%,整体使用率下降超过50%。

今日霍州(www.jrhz.info)©️

在通用Agent大爆发的当下,除了推出新模型之外,梁文锋或许还该考虑如何补上模型调用工具的能力短板,以满足更多AI开发者的新需求。

晚点LatePost 就曾爆料称,字节扣子团队开发扣子空间时,他们曾考虑优先使用『DeepSeek』-R1,但测试后发现其调用工具的能力不太理想,最终还是用了自家的『豆包』模型。

环比市面上主流的AI助手类应用,『DeepSeek』是唯一暂不支持多模态功能的产品。1月15日应用上线至今,6个月过去,如语音对话、图片生成、音乐生成、视频生成等,『DeepSeek』仍未提供支持服务。

作为通向AGI重要途径的多模态,其重要性正随着Agent生态的发展日益凸显。如果梁文锋再不向外界亮大招,其还将迎接更加现实的竞争挑战,即可能会将更多模型调用需求推向对手。

毕竟,现实环境中,从MiniMax到Kimi,其在最新更新的模型中,无一例外都强调了调用工具来构建Agent的特性。

借助R1开启深度思考浪潮后,梁文锋还能为Agent时代创造出新的惊喜吗?

特别声明:[梁文锋等来及时雨] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

荣耀X8d新机正式亮相:搭载『骁龙』6s Gen 2与亿级主摄(荣耀8x新机价格)

【CNMO科技消息】CNMO从外媒获悉,荣耀X8d新款手机已正式现身,尽管尚未举行官方发布会,但该机已在吉尔吉斯斯坦的零售网站上亮相。其核心配置包括一块6.77英寸、分辨率为1080×2392的AMOLED屏…

荣耀X8d新机正式亮相:搭载『骁龙』6s Gen 2与亿级主摄(荣耀8x新机价格)

重庆地铁回应“鞠躬式窗口”争议 符合标准将考虑建议

近日,有网友发文反映重庆地铁客服中心玻璃窗过低,导致交流不便。该网友在乘坐重庆地铁时,因NFC卡无法正常刷卡,前往轨道交通客服中心咨询。由于隔着玻璃窗声音听不清,她不得不全程弯腰驼背,将头贴近一个仅1.2米高的窗口,才能听清工作人员讲话

重庆地铁回应“鞠躬式窗口”争议 符合标准将考虑建议

5年前,被宋小宝抛弃,含泪离婚的霍晓红,如今过得还好吗?(宋小宋最新小说)

在别人眼里,宋小宝又矮又黑,但在她眼里,他却是事业有成的成熟男人。此时的他,已不再是当年那个对霍晓红言听计从的小伙子。是什么让霍晓红如此坚定地选择了宋小宝? 讲起霍晓红和宋小宝的相识,不得不提起他们在剧团的那…

5年前,被宋小宝抛弃,含泪离婚的霍晓红,如今过得还好吗?(宋小宋最新小说)

在一枚绿纹石里,Lola Rose 与 AHALOLO 找到共同的生长方向(一条绿石)

Lola Rose 与知名双人时尚频道 AHALOLO 的联名系列——常青藤绿纹石,正是在这样的自然意象中诞生。 Lola Rose ×AHALOLO 的常青藤绿纹石系列,像在手腕或颈间安放了一片小小的绿洲…

在一枚绿纹石里,Lola Rose 与 AHALOLO 找到共同的生长方向(一条绿石)

亮勒全屏鱼眼镜👓头:238度超广角拍摄与运镜功能解析(亮眼眼镜👓)

本文全面介绍亮勒全屏鱼眼镜👓头的特性、工作原理、应用领域及技术优势。该设备支持238度超广角拍摄,无暗角成像,适用于手机前置相机📷️和自拍🤳场景。文中详细解析了其光学设计原理、拍摄效果、使用技巧以及在短视频制作中的应用。

亮勒全屏鱼眼镜👓头:238度超广角拍摄与运镜功能解析(亮眼眼镜👓)