首页 • AI资讯 • AI资讯 • 前沿科技 • 不负责任预测一下 AI 大模型(LLM)的未来
一,先来看Gary Marcus在2024年3月11日的预测:
预测对了。Google王者归来,Gemini全家桶超越对手。OpenAI 仍然很稳,营收飞增。Anthropic在编程上一骑绝尘, X放出了一个幻觉严重的Grok, Meta掉队在Llama 4丢脸到团队崩盘,中国基本只剩3家 DeepSeek、qwen、豆包,法国1家)
预测对了,OpenAI确实没有发布GPT-5,模型进步有限。但强化学习的post-train作用被证实,thinking/reasoning的潜力还在挖掘中,也促使了Agent的大发展。
预测对了,deepseek是最大赢家,对AI应用层是有大利好的。
预测对了。其实OpenAI早就明白这一点,而前Google CEO施密特屡屡做出错误的判断,然后几次被中国的飞速追赶打脸,继而大惊小怪,变身中国威胁论者,做实了他美国军火商的立场。而国内,AI六小龙基本告别基模研发,兴也勃焉,亡也忽焉。
预测对了。幻觉仍然无解,但在垂直领域内,还是可以通过Prompt/SFT/RL等各种方法来暴力对齐,这给大公司内部必须follow AI潮流的应用团队带来点希望,也造成了Agent的遍地开花,极大缓解了FOMO心态,造就了一波新饭碗,当然,效果如何就不得而知了,至少很多场景,还是效果有限吧。
预测不算全对。现在企业应用的增长,最大增量份额在AI Coding,因为Vibe coding可以让程序员来人工修正幻觉问题,所以爆炸式增长已经出现了。
FOMO之下,利润不重要,只是小公司不得不退出这场游戏了。AI大模型的竞争,可以类比的是核武器、半导体的竞争。
大模型的智能水平很可能已经停滞 ,未来不太会有更聪明的模型了,从B200硬件的实质性停滞,模型参数量的停滞可以基本推论。再提升一个数量级,需要软硬件的跃升+新数据源的大规模开采。
RL只是在剪枝和建新通路,模型智能没有变化,只是学习了更好的做题方法,当然这有利于垂直AI,用好GRPO ,可以形成一套小场景的应用方法论。
模型的幻觉,很大程度上是AI缺少物理感知,空间感知,所以和机器人本体的结合有助于AGI的进步。但Embodied AI的 问题在于数据采样成本比智能驾驶高几万倍,这个领域发展是泡沫化 的,很长时间不会有实质性产品落地。
Long Context,短期/长期Memory,是大模型未来必须解决的问题。
AI Coding是革命性的 ,是这几年最大的商业机会,理由是和智能驾驶类似,有专业的人类司机/程序员来辅助AI矫正行为,规则清晰可量化,验证成本低,可形成闭环。当然,程序员的岗位会不会减少?我们不能自欺欺人,长远来说,一定会的,但好像司机的工作岗位也没减少,为什么呢?因为责任界定 问题和端到端交付 问题。
大热的AI Agent,我不太看好 ,至少在电商Agent上,还是锦上添花的应景式创新居多。除了客服应答、写研报这种不需要严格正确的场景,不知道Agent还擅长做好哪些事务?有些产品甚至还用上了Multi-Agents,如何解决多个模型之间的对齐和记忆同步呢。
相关文章