Meta回应大模型Llama 4训练作弊争议

Meta公司刚刚发布Llama 4 Scout与Llama 4 Maverick,但随后就被曝出模型训练测试集作弊。

在海外留学求职交流论坛“一亩三分地”上,发帖人自称是参与Llama 4训练的内部员工,他表示,Llama 4的内部模型性能始终无法达到开源SOTA(State-of-the-Art,顶尖水平)基准,公司领导层提出在训练后期将各种基准测试的“测试集”数据混入训练或微调数据中,以交出一份“好看”的成绩单。

知名科技媒体TechCrunch也发文质疑Llama 4的性能测试存在误导性。

针对舆论,4月8日凌晨,Meta AI部门副总裁Ahmad Al-Dahle发文回应表示,Llama 4一准备好就发布了,所以,不同服务中模型质量难免会有差异,Meta很快会修复这些漏洞提升性能,同时否认在测试集上进行了预训练。

特别声明:[Meta回应大模型Llama 4训练作弊争议] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

『张天爱』被指身材科技加持,对比三年前照片,网友:变化太大不像真人(『张天爱』几罩)

2.照片获赞无数这样的杂志写真自然少不了网友们的热烈讨论和称赞,大家纷纷表示被『张天爱』的美丽所吸引,称赞她的时尚品味和独特魅力,认为她的每一张照片都是一幅美丽的画卷,完全可以用来当壁纸。 三、时尚界的多样化…

『张天爱』被指身材科技加持,对比三年前照片,网友:变化太大不像真人(『张天爱』几罩)

北京经济技术开发区:支持建设6G人工智能实验室等重点机构,搭建6G+AI融合测试验证平台(北京经济技术开发区商务金融局)

钛媒体App 1月31日消息,北京经济技术开发区管理委员会印发《关于进一步加快建设全域人工智能之城的实施方案(2026—2027年)》。其中提到,适度超前布局前沿技术。坚持前沿技术与人工智能的双向赋能。推动“…

北京经济技术开发区:支持建设6G人工智能实验室等重点机构,搭建6G+AI融合测试验证平台(北京经济技术开发区商务金融局)

51岁『周迅』为看演出3天不吃淀粉,头顶有白头发了!(『周迅』演出)

在团队工作人员面前,『周迅』一点大牌『明星』️的架子都没有,完全是一个非常随和的存在。说实话,『周迅』现在的状态也未尝不是一种美,说明她的心态非常好,能够大方地接受自己自然老去的模样。为了这一碗泡面,『周迅』居然在泳池里…

51岁『周迅』为看演出3天不吃淀粉,头顶有白头发了!(『周迅』演出)

大衣哥刚被传跳楼,转头在西双版纳开唱!真实处境曝光,真相比传言解气(大衣哥情况)

有人说他窝囊,被人这么折腾还不搬走,可朱之文有自己的理:“祖辈在这儿住了几百年,我又没做亏心事,躲啥?”有人劝他搞直播带货,说能赚更多钱,他摆摆手:“人不能贪,我把唱歌这一件事做好就行。” 就像他自己说的…

大衣哥刚被传跳楼,转头在西双版纳开唱!真实处境曝光,真相比传言解气(大衣哥情况)

下颌功能紊乱怎么治疗(下颌功能紊乱综合症能治好吗)

下颌功能紊乱可以通过调整咬合习惯、物理治疗、药物治疗、咬合板治疗和手术治疗等方式改善。 避免长期单侧咀嚼、紧咬牙等不良习惯,进食时选择软质食物,减少坚果等硬物的咀嚼

下颌功能紊乱怎么治疗(下颌功能紊乱综合症能治好吗)