前沿科技
OpenAI 重回 AI 竞赛——DeepSeek R1 与 OpenAI o3-mini 的比较
整个一月份,我都在黑 OpenAI。我反复公开抨击他们。我广泛地谈论了他们的开源竞争对手 DeepSeek R1,以及一个由中国研究人员组成的小团队如何在他们自己的游...
DeepSeek大模型参数散存技术解析
一、参数散存技术的核心思想与架构基础参数散存技术是DeepSeek大模型实现高效计算与资源优化的核心创新之一。其核心理念在于通过动态分配与选择性激活模型参...
Gemini 2.0模型更新:谷歌最新AI大模型全面开启智能时代
引言2025年2月5日,谷歌人工智能实验室(Google DeepMind)发布了最新的Gemini 2.0模型系列更新,包括2.0 Flash、Flash-Lite和Pro实验版本。这些AI大模型的发...
DeepSeek-R1技术详解
OpenAI 的 o1 系列模型率先通过增加推理过程中思维链(Chain-of-Thought, CoT)的长度,引入了推理时扩展,在数学、编程和科学推理等各种推理任务中取...
DeepSeek 评朱啸虎:嘴里都是主义,心里全是生意,跪得比谁都快
近期,由中国企业开发的人工智能模型 DeepSeek 在全球科技界引发广泛关注。作为一个具有独特技术特点的大语言模型,DeepSeek 在性能表现和应用潜力方面展现出...
DS MoE架构,优势与隐忧
如果说大模型是“智慧工厂”,那么DeepSeek采用的MoE(Mixture of Experts)架构,就是把这座工厂的“工人”安排得井井有条,让它们高效又省力地完成任务。相比传...
奥特曼扯出GPT-5,再看DeepSeek和梁文锋
人们似乎已经忘记了GPT-5。没错,我们去年也写过一篇文章,说GPT-5已经休克了。不过,在对2025年的展望中,我们认为基础模型的进展,仍然最终决定能否实现AGI...
我让AI写100章小说大纲,只有谷歌Gemini 2.0打破了千字"垃圾"魔咒!
"写到第20章,DeepSeek就没力气了...""写到第30章,千问Max也撑不住了...""写到第40章,ChatGPT就开始胡言乱语了...""Cl...
OpenAI被逼,推出 o3-mini 模型
OpenAI 最近推出了新的推理模型 o3-mini,并首次对 ChatGPT 的免费用户开放,引起了 AI 领域的广泛关注。这一举措不仅是 OpenAI 技术上的又一次突破,也...
DeepSeek距离AGI,只差一个“腾讯”
在DeepSeek刷屏后,黑悟空制作人冯骥第一时间点评说:这是国运级的创新。这话不假。过去短短的十天里,DeepSeek让很多事情都发生了微妙的变化。备受AI行业追...