前沿科技
DeepSeek-R1技术详解
OpenAI 的 o1 系列模型率先通过增加推理过程中思维链(Chain-of-Thought, CoT)的长度,引入了推理时扩展,在数学、编程和科学推理等各种推理任务中取...
DeepSeek 评朱啸虎:嘴里都是主义,心里全是生意,跪得比谁都快
近期,由中国企业开发的人工智能模型 DeepSeek 在全球科技界引发广泛关注。作为一个具有独特技术特点的大语言模型,DeepSeek 在性能表现和应用潜力方面展现出...
DS MoE架构,优势与隐忧
如果说大模型是“智慧工厂”,那么DeepSeek采用的MoE(Mixture of Experts)架构,就是把这座工厂的“工人”安排得井井有条,让它们高效又省力地完成任务。相比传...
奥特曼扯出GPT-5,再看DeepSeek和梁文锋
人们似乎已经忘记了GPT-5。没错,我们去年也写过一篇文章,说GPT-5已经休克了。不过,在对2025年的展望中,我们认为基础模型的进展,仍然最终决定能否实现AGI...
我让AI写100章小说大纲,只有谷歌Gemini 2.0打破了千字"垃圾"魔咒!
"写到第20章,DeepSeek就没力气了...""写到第30章,千问Max也撑不住了...""写到第40章,ChatGPT就开始胡言乱语了...""Cl...
OpenAI被逼,推出 o3-mini 模型
OpenAI 最近推出了新的推理模型 o3-mini,并首次对 ChatGPT 的免费用户开放,引起了 AI 领域的广泛关注。这一举措不仅是 OpenAI 技术上的又一次突破,也...
DeepSeek距离AGI,只差一个“腾讯”
在DeepSeek刷屏后,黑悟空制作人冯骥第一时间点评说:这是国运级的创新。这话不假。过去短短的十天里,DeepSeek让很多事情都发生了微妙的变化。备受AI行业追...
Why DeepSeek:技术剖析及行业影响深度解读
0.前言自一月以来, DeepSeek 在 AI 领域引发了极大的热度,也出现了大量分析文章。其中来自 Leonis Capital 于 2.6 发表于 Substack 上的文章:「DeepSeek: ...
开箱即用!DeepSeek大模型一体机来了
社团招新京东云重磅发布DeepSeek大模型一体机,基于“本地化开箱即用”的理念,提供从底层算力、模型服务、推理能力、应用开发的全栈解决方案,为金融、政府及...
朱啸虎现实主义故事1周年连载:“DeepSeek快让我相信AGI了”
在刚过去的短短20天内,金沙江创投主管合伙人朱啸虎的态度发生了惊奇逆转。1年前,2024年初,在我们关于《朱啸虎讲了一个中国现实主义AIGC故事》的报道中,朱...