当前位置: 首页 足球 西甲

看了几场世界杯淘汰赛,我对大模型竞争的认识加深了

来源:24直播网 发布时间:2026-07-02 16:00:38

今天凌晨1点多,当英格兰队到了下半场60多分钟还落后于刚果(金)时,我们世界杯看球群的朋友已经开始严肃讨论“图赫尔是否该下课”,以及“英国足球流氓会怎么闹事”的问题了。然后,凯恩天神下凡,攻入一球。我们又开始讨论“能不能90分钟结束战斗,别打加时赛了”。懂球的朋友表示,可能性不大,刚果(金)的防线扎得很牢固、防守意志坚决,看样子还是得120分钟决胜负。

然后,凯恩又天神下凡了,英格兰涉险过关。巧在两次都是刚换上场的戈登助攻。图赫尔一下子从下课边缘到了封神边缘,相当于从跌停板被骤然拉到涨停板。不过,公允的说,决定比赛的因素很简单:巨星的个人能力。

前天姆巴佩的双响,以及哈兰德的进球,道理是一样的。严格地说,巴西VS日本那场比赛,维尼修斯起到了类似作用:虽然他没有进球,但每次冲进日本队防守三区都会引发一阵混乱,充分显示了个人能力的碾压。日本没有巨星,第一档次的球星都很少,哪怕守进了加时赛,胜率也是渺茫的——这一点应承认。

这是世界杯淘汰赛,一场定胜负,90-120分钟结束之后,一个继续前进、一个打道回府。这种场合只有团队精神是不够的,必须有超级巨星的灵光一闪。我想起了《点球成金》(Moneyball),男主角依靠数据分析在常规赛高歌猛进,到了季后赛却始终拿不下最终的锦标,电影本身给出了解答:

最优秀的球员都有溢价,依靠数据分析去淘性价比高的球员,意味着你的每个位置都不是最顶尖的。优秀与顶尖之间,是一道鸿沟。

在淘汰赛中,你必须有能力战胜任何对手,关键时刻一定需要球星“硬解”。这种“硬解”能力很昂贵,没有任何高性价比的替代品。

我很喜欢《最后之舞》(The Last Dance)这部纪录片,其中整整一集都用来描述1998年NBA总决赛的第六场——乔丹封神之战。皮蓬一开场就受伤了,主场作战的爵士士气高昂,乔丹下半场体力不支,好几个投射都投短了,只能依靠突破和罚球得分。最后时刻,乔丹在自己投丢过好几次的区域拔地而起,最后一投,拿下了第六个总冠军。

爵士输了。讲道理吗?不讲。所以乔丹值3000万美元年薪,所有人得围绕他建队。其实马龙和斯托克顿是很伟大的球员,可惜凡人和篮球之神之间确实是有差距的,不讲道理的硬解能力就是最大的差距。

说了这么多竞技体育,跟大模型有什么关系?关系可大了。最近几天,我在朋友圈看到了好几篇讨伐Anthropic的文章,甚至直斥其为“邪恶势力”。天下苦Anthropic久矣:定价太高,客服很差,对某些国家的用户很不友好,新出的模型还不让人用,等等。你用Claude的频率越高,就越是容易对它的开发商一肚子火,十分期待有人能取而代之。

DeepSeek V4, Kimi K2.5, GLM 5.2...诞生之时均被AI开发者社区追捧为“Claude杀手”。这除了说明它们有一定实力,还说明Anthropic何等不得人心。哪怕是提价之后的DeepSeek,API价格也只有Claude的一个零头。至于我,一个普通的Claude Pro用户,最痛苦的就是模型额度用的太快,哪怕你不编程、只做文本分析,也跟沙漠里的降雨一样,稍微看到个影子就没了。

要不是Claude实在太强大,我怀疑世界上不会有任何人用它。这是句真话,也是句废话,我们还可以这样改写:

要不是凯恩太强大,不会有人花1亿欧元在他29岁时买他;

要不是姆巴佩太强大,不会到哪个球队都混成“总监”,主宰更衣室运作;

要不是梅西太强大,2022年哪里轮得到阿根廷夺冠?

要不是哈兰德太强大,挪威在世界杯淘汰赛赢球恐怕是痴人说梦。

我是GPT的重度用户,有27个月不间断的付费历史;就连我也从2个月前开始叛逃到Claude(尽管还保留了GPT Plus)。因为有些任务就是只有Claude能完成,准确的说,只有Claude Opus 4.7/4.8(再加上刚刚恢复使用的Fable 5)能完成。GPT就是差那么一点点意思,至于其他模型,我不想说。

除了大家公认的编程和Agent能力之外,对于复杂的长文本,例如小说、剧本、哲学著作、非虚构作品的语义分析,Claude给我的答案也是最好的。从前有一阵子,GPT是最好的(尤其是GPT 4o时代),但是最近半年越来越不好,不是说它退步了,而是它赶不上Claude的进步速度。有一些言外之意只有Claude Opus看得出来。我还想指出一点:Opus对于“互文”,即文本之间的互相引用、化用、戏仿,看得非常准,已经接近相关文科专业博士生的水平,而且它看到这些事情只需要几秒钟而非几天。

更便宜的模型方便吗?方便,至少不会像Anthropic这个神经病举着大棒看谁都不顺眼。

更便宜的模型能完成任务吗?嗯,这个问题就复杂了,得看是什么任务……

莱万走后,舒波莫廷一度在拜仁大杀四方,为什么拜仁还要买凯恩?是舒波莫廷没有用吗?还是舒波莫廷不够便宜、性价比不够?

阿森纳花1亿英镑买了赖斯,是这个世界上没有高性价比的后腰了吗?这个夏天,好像所有英超豪门都在以1亿英镑争夺安德森,是脑子都进水了吗?价值3000-5000万英镑的后腰不好用吗?

还有在拜仁刚打了两个赛季好球的奥利塞,怎么皇马突然就2亿欧元求购了?如果拜仁愿意卖,相信愿意以类似价格买入的绝不止皇马。

答案从来不在数据分析表上,而在球场上。今天凌晨凯恩的两个进球,昨天奥利塞的两次助攻,还有赖斯和安德森能上能下、跑满整个球场的表现,证明他们就是关键时刻具备硬解能力的球星。别忘了本届欧冠,赖斯对阵皇马竟然单场攻入两粒任意球,这种不讲道理的硬解能力值不值1亿英镑?

所以Anthropic就算再邪恶、再傲娇,大家捏着鼻子也得受着。今天早上Claude Fable 5刚恢复使用,我马上就狠狠消耗了一波模型额度。除非GPT-5.6全面发布并且水平大幅提升,否则我觉得今年之内,我最重要的生产力+生活辅助双料工具仍然是Claude. 因为我不养龙虾、没有多少日常Agentic Worflow任务,所以更便宜的大模型API对我用处不大,还是得忍痛给Anthropic送钱。

附带说一句,在对Gemini失去信任一个多月后,我再次成为了Google AI的付费用户,唯一原因是Nano Banana Pro的生图能力。我对比了GPT Image-2和Nano Banana Pro,认为前者在很多方面都很强大,但比后者还是差一点点。我希望生成国风或日漫二次元风格的人设和场景图片,不知道为什么,GPT在这方面比较拙劣。几乎所有专业AI漫剧公司的主力生图模型都是Nano Banana Pro,不是因为其他模型没有用,而是因为都不能稳定的达到最高要求。

现在最尴尬的反而是OpenAI. 据说Sam Altman决定推迟IPO的原因,是难以保证获得1万亿美元以上的估值。那么问题来了,Anthropic上一轮融资的估值已经是9620亿美元,离1万亿只有一步之遥;为何早在今年年初就达到8600亿美元估值的OpenAI,不能更进一步呢?

因为GPT不再是“最优秀的模型”,只是“优秀的模型之一”。在文本任务和Coding方面比Claude略逊一筹,在多模态方面显然打不过Gemini(以及Seedance)。这就好比一个球员的定位不是“超级巨星”,不具备无条件硬解能力,只是“合格的一流球员”——实际能力可能只有5-10%的差距,但这就是天与地的区别。

因为最强的模型具备定价权,整个市场的大部分利润将注定被它吃掉。竞争对手可以走性价比路线,但是严格地说,这种路线不会对“最强的模型”形成竞争,就像球队里的轮换球员不会对超级巨星形成竞争。要拿到超级巨星的薪酬,只有一条路:在实力上达到超级巨星的水平,也就是具备硬解能力。

好像所有人都不喜欢姆总,但是姆总到了世界杯就是能进球,而奥利塞就是能给他喂球,所以这两人就高居巨星身价榜的前列。等到有一天,姆总不能进球了,或者进球也改变不了命运了,那不用任何人骂他,他自己会从神坛下来的。在皇马其实有点这个意思,不过还早。

底线是:就算姆总走下神坛了,替换他的肯定是另一个1亿乃至2亿欧元身价的超级前锋,而不会是好几个3000万身价的前锋之和。皇马用何塞卢、拜仁用舒波莫廷都是权宜之计,否则球迷会造反,球队也不可能维持最高水平的竞争力。

热门视频

更多 >>

相关资讯

相关录像

相关集锦

热门TAG