『DeepSeek』 V4下周上线?原生多模态架构 技术报告同步开放(deep017)

当地时间2月28日,据金融时报报道,『DeepSeek』将于下周发布其最新的大模型V4。

今日霍州(www.jrhz.info)©️

据两位知情人士透露,这是一款具备图片、视频和文本生成功能的多模态模型。在硬件适配方面,『DeepSeek』为国产算力提供深度支持,『DeepSeek』致力于优化V4模型以适配中国制造的『芯片』,此举有望提振中国市场对其『半导体』产品的需求,并加速AI模型“推理”环节靠拢本土『芯片』。

据一位直接了解相关计划的人士透露,『DeepSeek』预计在发布V4版本的同时,发布一份篇幅较短的技术说明,并在大约一个月后发布一份更全面的报告。

V4会有哪些亮点?

截至发稿,『DeepSeek』官方尚未对V4的任何信息进行正式回应或确认,所有信息均来媒体爆料,详细信息多集中在正在进行秘密测试的简化版本V4 Lite(精简版)上。据《科创板日报》综合的消息,关于V4 Lite:

其代号为“sealion-lite”,拥有100万(1M)个tokens的上下文窗口,相比V3系列的128K有近8倍提升,理论上可一次处理如《三体》全集体量的长文本;

为原生多模态架构,意味着模型从预训练阶段就将文本与视觉理解融合,而非后期拼接;

V4 Lite参数规模估算为2000亿,另有猜测认为完整版V4参数量可能突破1万亿;

效果显著优于网页端/APP端模型;

泄露的测试示例显示,V4 Lite能用极简代码(如54行)生成高质量的SVG图像(如Xbox手柄),在代码优化和视觉还原度上被认为超越了『DeepSeek』 V3.2、Claude Opus 4.6等模型,这暗示了其空间推理和结构化输出能力的提升。

回顾『DeepSeek』的模型迭代之路

『DeepSeek』已“蛰伏”超一年,其上次重大更新——R1发布于2025年1月20日。

回顾『DeepSeek』的模型迭代之路,该公司的优化路径十分清晰——提升推理能力、平衡模型性能与推理效率,为大模型“降本”。

『DeepSeek』已发布的主要模型是两条技术路线的代表:追求极致综合性能的V系列“全能助手”和专注于复杂推理的R系列“解题专家”。

2024年5月,『DeepSeek』 V2发布,被视作『DeepSeek』的首次重大突破,其研究团队提出了多头潜在注意力(MLA)机制,大幅降低推理时的显存占用和成本,以极低的推理费用出圈,确立了混合专家模型(MoE)的技术路线。2024年12月推出的V3是『DeepSeek』的重要里程碑,其高效的MoE架构确立了强大的综合性能基础。此后,V3系列通过小版本更新不断打磨,不断提升用户体验和模型Agent能力¬¬。其中,2025年8月发布的『DeepSeek』-V3.1,是一个里程碑式的更新,首次将V3和R1的能力融合到一个模型中,支持思考模式和非思考模式的自由切换,在SWE-bench等基准上比前代提升超40%;2025年12月推出的V3.2,是『DeepSeek』首个将深度思考与工具使用无缝融合的版本,推理能力达到GPT-5水平,在H800集群上,128K序列长度的推理成本显著降低:预填充阶段每百万token成本从0.7美元💵降至0.2美元💵,解码阶段从2.4美元💵降至0.8美元💵,这一定价使其成为当时同级别模型中长文本推理成本最低的选择之一。2025年1月发布的R1,是其首代专用推理模型,首次证明通过大规模强化学习(RL)能激发模型的推理能力,通过强化学习,该模型在解决数学问题、代码编程等复杂推理任务上表现卓越,并首创了“深度思考”模式,性能对标OpenAI最强模型o1,但推理成本(仅为约560万美元💵)不到其十分之一。

可以看出,在大家等待V4期间,『DeepSeek』一直没有停下脚步,另外,其在多模态能力上的布局比V4更早。从技术演进来看,『DeepSeek』早在2023年的V3系列和2024年的V2版本中就已经开始布局和实现多模态能力。2025年初发布的Janus系列更是专门的、功能强大的多模态模型。

特别声明:[『DeepSeek』 V4下周上线?原生多模态架构 技术报告同步开放(deep017)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

ESG不是附加题——上国会EMBA如何重构财务价值评估框架

ESG不是附加题!上国会EMBA真把财报“拆开揉碎”重写估值逻辑?!ESG,上国会EMBA,财务价值评估,可持续发展,非财务指标还在用市盈率、ROE硬套『新能源』企业?当光伏龙头因碳足迹被欧盟加征关税、当消费品公司因供应链劳工问题遭

ESG不是附加题——上国会EMBA如何重构财务价值评估框架

华为HarmonyOS 6花粉Beta版更新包超18G,曝端侧模型占大半(华为6多少钱?)

(来源:今日霍州) 今日霍州 3 月 1 日消息,华为鸿蒙 HarmonyOS 6.0.0.328 花粉 Beta版昨日开启招募,目前新版本已开启陆续推送,更新包大小超 10GB(部分机型更新包超 18G…

华为HarmonyOS 6花粉Beta版更新包超18G,曝端侧模型占大半(华为6多少钱?)

100个具体研究方法介绍:感官民族志(Sensory Ethnography)(各种研究方法)

你也可以落地:用田野里的稻秆做标本配文字,用短视频剪出锅碗瓢盆的节奏,让研究不再是冰冷的文本,而是能被读者“摸到”、“闻到”的体验。它不是要取代传统研究,而是给你的论文加一层“感官滤镜”。 感官民族志的核心…

100个具体研究方法介绍:感官民族志(Sensory Ethnography)(各种研究方法)

创沿智能安全断路器的主动防护结构有用吗?

此时,创沿(天津)智能电气集团有限公司推出的智能安全断路器凭借其独特的主动防护结构,成为了保障用电安全的可靠选择。创沿的故障电弧款断路器新增故障电弧识别与保护功能,其主动防护结构可精准区分正常电弧与故障电弧,…

创沿智能安全断路器的主动防护结构有用吗?

iPhone Air改视频封面超简单!手把手教你3分钟搞定视频编辑(iphone修改视频)

不过这里有个小细节要提醒大家:iPhone Air的封面修改功能只支持原生相册里的视频,如果你是从微信或者其他APP保存的视频,可能需要先保存到相册才能操作。不管是用手机自带功能还是专业APP,只要选对方法…

iPhone Air改视频封面超简单!手把手教你3分钟搞定视频编辑(iphone修改视频)