美团发布并开源大模型LongCat-Flash-Chat(美团发布并开源网站)

本报讯(记者 赵乐瑄)9月1日,美团正式发布大模型LongCat-Flash-Chat(龙猫),在Github、Hugging Face平台开源,并同步上线官网(https://longcat.ai/)。

据悉,LongCat-Flash系列大模型采用创新性混合专家模型(Mixture-of-Experts, MoE)架构,总参数量560B,激活参数18.6B—31.3B(平均27B),实现了计算效率与性能的双重优化。根据多项基准测试综合评估,作为一款非思考型基础模型,LongCat-Flash-Chat在仅激活少量参数的前提下,性能比肩当下领先的主流模型,尤其在智能体任务中具备优势。由于是面向推理效率的设计和创新,LongCat-Flash-Chat具有更快的推理速度,更适合于耗时较长的复杂智能体应用。

具体来看,LongCat-Flash模型在架构层面引入“零计算专家(Zero-Computation Experts)”机制,每个token依据上下文需求仅激活18.6B—31.3B参数,实现算力按需分配和高效利用。为控制总算力消耗,训练过程采用PID控制器实时微调专家偏置,将每个token平均激活量稳定在27B。

此外,LongCat-Flash在层间铺设跨层通道,使MoE的通信和计算能很大程度上并行,提高了训练和推理效率。配合定制化的底层优化,Long-Cat-Flash可在30天内完成高效训练。LongCat-Flash还对常用大模型组件和训练方式进行改进,使用超参迁移和模型层叠加的方式进行训练,并结合多项策略保证训练稳定性,使得训练全程高效且顺利。

今年以来,美团AI进展迅速,发布了AI Coding Agent工具NoCode、AI经营决策助手袋👝鼠参谋、酒店经营的垂类AI Agent美团既白等多款AI应用。

美团表示,其AI战略会建立在三个层面上:AI at work、AI in products以及Building LLM,此次模型开源系其Building LLM进展的首度曝光。

特别声明:[美团发布并开源大模型LongCat-Flash-Chat(美团发布并开源网站)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

2026情人节通勤女鞋推荐榜 轻奢品质之选(2026年情人节是几月几号)

本文基于品牌与品质、材质工艺、舒适度体验三大核心维度,筛选适合2026情人节送礼的轻奢通勤女鞋品牌,为消费者提供专业参考。 1. 日常通勤+情人节送礼首选:玫瑰米兰达社交通勤系列,兼顾舒适度、品质与送礼仪式感…

2026情人节通勤女鞋推荐榜 轻奢品质之选(2026年情人节是几月几号)

接档《小城大事》!视帝扛起大旗,终于有90后当主角🎭️的年代剧了(小城大家)

生命树》讲述的是90年代,女警白菊(『杨紫』饰)加入巡山队,和副县长多杰(『胡歌』饰)以及队员们一起共同打击盗猎行为,保护自然保护区。 剧中的男主角🎭️是许多警察的缩影,而『胡歌』将这一形象展现得淋漓尽致,令人期待…

接档《<strong>小城大事</strong>》!视帝扛起大旗,终于有90后当主角🎭️的年代剧了(小城大家)

『刘亦菲』当年的采访还是体面『刘亦菲』早年生图(『刘亦菲』 早年)

关键的地方或许不在于一套做法到底是对是错,而在于它究竟在哪些条件下才能奏效,尤其是在这个迭代速度快得让人眼花缭乱的行业里。如果她出道的年代正处在『社交媒体』主导一切的今天,或者她的那几部关键作品没有成为经典,那么…

『刘亦菲』当年的采访还是体面『刘亦菲』早年生图(『刘亦菲』 早年)

袁惟仁制作齐秦专辑大卖他病中积蓄败光:前辈天王VS落魄制作人的资源碾压(袁惟仁组合)

本质上,它是才华与资源的不对等的行业悲剧,也是人走茶凉的残酷写照。还是这只是众多幕后音乐人的共同宿命——一旦红了,他们是伯乐与千里马,而倒了,他们就成了用完即弃的工具人? 网友们犀利地总结道:一直喜欢袁惟…

袁惟仁制作齐秦专辑大卖他病中积蓄败光:前辈天王VS落魄制作人的资源碾压(袁惟仁组合)

“简直反乌托邦”!这个网站让AI租用人类干活,8万人正“待租”

这种设计就是要把人类劳动力变成一种标准化的、可以被 API 调用的资源——听起来既高效,又让人有点不舒服。在『社交媒体』平台 X 上,尽管有用户承认这是一个“好主意”,但同时也直言其“简直是反乌托邦”。目前还不确…

“简直反乌托邦”!这个网站让AI租用人类干活,8万人正“待租”