推理大模型与普通大模型的区别是什么?

核心观点:别把推理大模型看成普通大模型的简单升级版!这是两种基于不同工作机制、训练方法和运行机制的AI模型。普通大模型,如ChatGPT、Qwen这些,工作流程...

DeepSeek R2该来了!

DeepSeek R1自2025年1月正式发布后,便迅速在全球范围内掀起波澜,在很短时间内,各大厂商都在自己的产品中支持部署了DeepSeek。在DeepSeek R1发布的影响下,...

GPT-5 整合所有超强 Agent,秒杀 Manus?我们拭目以待!

我有很多朋友就深陷这种 “工具内耗”:他们用 Cursor 写代码,Deep Research 作报告,Notion 记笔记,每天切来切去,键盘都弄烦了!这不,OpenAI 透露 GPT-5 ...

ChatGPT Codex,OpenAI的第二款RFT训练的Agent

正当我的ChatGPT续费了Pro会员之后,我感觉只是买了o3和DeepResearch的用量有些不值的时候,OpenAI发布了ChatGPT Codex功能。Codex功能目前还是Pro会员独享,...

OpenAI:GPT-5就是All in One,集成各种产品

GPT-5将会集大成于一体?!就在发布“最强编程智能体Codex”之后,OpenAI又接着在Reddit举行了“有问必答”活动。公司研究副总裁Jerry Tworek,剧透了下一代基础...

AI趋势的一些思考和预判

今年春节期间DeepSeek-R1爆火以后,可以说是一夜之间就完成AI在全球的全民普及,这是AI发展史上,自OpenAI在2022年推出ChatGPT之后最重要的里程碑,它让中小...

完了,AI 中台比数据中台更短命

目前,最近有读者给我发了一篇讲解“AI 中台”的内容,问我针对 AI中台有什么想法?我直接回答:没有想法,但是今年确实有不少企业推出了 AI 中台,热度也在持...

🧠 解码大语言模型的记忆力:上下文长度的前世今生

在与ChatGPT、Claude等大语言模型对话时,你是否好奇:它们是如何记住我们之前的对话内容的?为什么有时它们能记住很长的对话,有时却会"失忆"?今...

🧠 解码大语言模型的记忆力:上下文长度的前世今生

在与ChatGPT、Claude等大语言模型对话时,你是否好奇:它们是如何记住我们之前的对话内容的?为什么有时它们能记住很长的对话,有时却会"失忆"?今...

红杉资本Sequoia AI Ascent 2025 Keynote的一些重要判断

Ideas are my own.    上周,红杉资本Sequoia Captial一年一度的AI Ascent 2025上,三个Sequoia合伙人Pat Grady、Sonya Huang与Konstantine Buhler做了题为《...
1 295 296 297 298 299 596