当前位置: 首页 > 实时讯息 >

Llama 4重测排名跌至32名

0次浏览     发布时间:2025-04-13 19:32:00    

LMArena 更新了Meta最新发布的开源大模型Llama-4-Maverick的排名,从此前的第2名,直线掉到了第32名!

这也实锤了此前开发者对Meta为刷榜排名向LMArena提供了“特供版”的Llama 4大模型的质疑。

4月6日,Meta发布了最新的大模型Llama 4,包含Scout、Maverick和Behemoth三个版本。其中,Llama-4-Maverick在LMArena公布的Chatbot Arena LLM 排行榜中的排名第二,仅次于Gemini 2.5 Pro。

然而,随着开发者实际使用Llama 4大模型开源版的效果陆续曝出,Llama 4口碑急转直下。有开发者发现Meta提供给LMArena的Llama 4版本与提交给社区的开源版本不同,因而Meta被质疑为刷榜作弊。

4月8日,Chatbot Arena官方发文确认了用户的上述质疑,公开表示Meta提供给他们的是“特供版”,并考虑更新排行榜。

(9729533)

相关文章

    3年,15个位次,中国数字教育如何培养适应未来的人?

    近日,以“教育发展与变革:智能时代”为主题的2025世界数字教育大会落幕。作为《教育强国建设规划纲要(2024—2035年)》发布后的首个世界级会议,向世界展示了其在教育数字化方面的显著成就,特别是在大模型技术应用于教育领域的实践经验,为全球教育发展提供了中国智慧和中国方案‌。“数字教育”的最新中国

    以“数智国云”赋能新疆高质量发展中国电信新疆公司发布AI创新应用产品

    来源:【通信信息报社】​(图为中国电信新疆公司“数智国云 共谱新篇——2025中国电信新疆公司AI创新应用产品发布会现场)2025年5月16日,中国电信新疆公司“数智国云 共谱新篇——2025中国电信新疆公司AI创新应用产品发布会”在乌鲁木齐举办,集中发布新疆息壤算力调度平台、量子+系列、星辰大模型

    美加征关税促制造业回流?吉前总理:从台积电看行不通!

    吉尔吉斯斯坦前总理卓奥玛尔特·奥托尔巴耶夫5月20日在《中国日报》撰文称,美国政府近期宣布对贸易伙伴加征高额进口关税,意在迫使外国制造商将生产线迁至美国。然而,从台积电美国亚利桑那州新厂的亏损情况来看,这条路注定行不通。漫画作者:中国日报 马雪晶制造业回流之路行不通文章指出,愿意在美国投资设厂的外国

    “子畏于匡”地理考及其人文意义

    “子畏于匡”两见于《论语》:“子畏于匡,曰‘文王既没,文不在兹乎?天之将丧斯文也,后死者不得与于斯文也;天之未丧斯文也,匡人其如予何?’”(《论语·子罕》)“子畏于匡,颜渊后。子曰‘吾以女为死矣。’曰‘子在,回何敢死?’”(《论语·先进》)学界对“子畏于匡”的解释,更多地集中于辨析“畏”的含义,但是

    明星站台“胖都来”,莫让“祝福”沦为扰乱市场的“帮凶”

    □李沙祺日(中国社会科学院大学)近日,浙江一家名为“胖都来”的线下购物商场开业,多位明星发视频祝贺。该商场名称引发争议,不少网友质疑这是在碰瓷“胖东来”。(5月3日 澎湃新闻)明星们的站台祝福,看似为商场增添了光环,却也暴露出一个有待考量的问题:当明星为商业主体录制祝福视频时,是否该对其负责?现如今