Llama 4遭质疑:AI发展停滞?NYU教授断言规模化时代已终结
近期,人工智能领域掀起了一场关于Llama 4模型的热烈讨论,多位业界领袖和学者纷纷发声,对Llama 4的表现提出了质疑,并探讨了其对AI未来发展的影响。
一位知名AI公司CEO深入剖析了Llama 4存在的五大疑点,引发了广泛共鸣。他指出,Llama 4所宣称的突破并未如愿带来显著的智能提升,反而暴露出一系列问题。同时,有圈内人士悲观地认为,Llama 4的表现或许标志着单纯依靠模型规模扩大(Scaling)来提升AI能力的时代已经结束,大型语言模型(LLM)在推理能力上的欠缺依然难以弥补。
Anthropic公司的CEO Dario也制作了一段长视频,详细列举了Llama 4的六大疑点。他逐一剖析了Llama 4在性能、发布时机、测试数据等方面的争议,指出其可能存在的夸大宣传和测试作弊等问题。Dario的剖析进一步加剧了业界对Llama 4真实能力的怀疑。
纽约大学教授马库斯则在博客中总结了当前AI领域的现状,直言不讳地表示,Scaling时代已经结束,模型仍然无法可靠推理,金融泡沫正在破裂,GPT-5的推出遥遥无期,对不可靠语言模型的过度依赖已经让世界陷入了困境。他此前做出的多项预测,如今看来一一应验。
马库斯强调,大语言模型并非解决问题的万能钥匙,我们需要探索更可靠的方法。他指出,像OpenAI和Anthropic这样的公司,虽然致力于推动AI技术的发展,但面对高昂的研发成本,它们的资金储备显然难以为继。如果投资者对经济衰退的预期增强,AI领域的投资将进一步缩减,从而导致AI进展放缓。
Dario在之前的采访中曾提到,战争可能是阻止AI进步的一个因素。然而,如今看来,系统的另一种混沌状态似乎已经提前到来。他预测,如果技术无法继续向前发展,资本化不足将成为AI进步的重大阻碍。Llama 4的争议无疑加剧了这一趋势。
关于Llama 4的具体疑点,首先在于其所谓的业界领先的一千万个token的上下文窗口是否名副其实。有对比数据显示,早在Llama 4发布之前,Gemini 1.5 Pro就已经达到了这一标准,并且在长上下文深度理解基准测试中表现优异,而Llama 4的中等模型和小模型则表现不佳。
其次,Llama 4选择在周六发布也引发了诸多猜测。这一非典型的发布时间,以及模型训练数据截止时间的滞后,都让人怀疑meta是否在刻意避开公众视线,试图掩盖模型的不足。关于Llama 4在LM Arena上是否存在作弊行为的质疑也甚嚣尘上,尽管LM Arena已经公开了测试数据并表示将重新评估排行榜,但这一事件依然对Llama 4的声誉造成了不可磨灭的影响。
Llama 4在编码基准测试中的糟糕表现,也与其宣传的“取代中级程序员”的言论形成了鲜明对比。在ADA的Polyglot编码基准测试中,Llama 4 Maverick的得分惨不忍睹,远低于Gemini 2.5 Pro等竞争对手。这一系列争议和质疑,无疑给Llama 4的前景蒙上了一层阴影。
本文链接:http://knowith.com/news-1-9865.htmlLlama 4遭质疑:AI发展停滞?NYU教授断言规模化时代已终结
声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
四川农业大学考研(四川农业大学考研分数线2023)
西北工业大学考研(西北工业大学考研分数线2023)
西双版纳研究生院 研究生考事业单位是不是免笔试啊
医学学硕(医学学硕与专硕的区别)
2014经济学考研辅导:宏观经济学案例分析(1)
2014经济学考研辅导:宏观经济学案例分析(20)
青岛考研 青岛大学研究生好考吗
考研复试考试时间(考研复试考试时间一般是什么时候)
护理研究过程中应特别考虑到(护理研究过程中应特别考虑到什么)
考研去福州大学怎么样_考研去福州大学怎么样啊
印度来那度胺哪里买购买渠道有哪些?真实购买印度来那度胺多少钱一盒价格一览表:售价(约900元)一盒!国内购买印度来那度胺(10mg30)价格折合人民币约900元一盒
推荐:印度吡非尼酮多少钱一盒/一瓶?2025印度吡非尼酮价格一览
酒香传万年 浙江上山遗址发现世界上最早稻米酒