前沿科技

万字长文详解DeepSeek-R1模型工作原理

DeepSeek的发布震撼了整个科技行业,它迅速超越了OpenAI的ChatGPT,成为苹果美国地区和中国地区应用商店免费APP下载排行榜第一位,并且导致芯片制造商英伟达...

从0到1了解DeepSeek

1 DeepSeek 公司成立背景与发展历程DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,由幻方量化的联合创始人梁文峰创立。公司自2023年7月年成立以来...

中国 AI 资产重估叙事

2024 年年底的时候,我看到过一些提醒,说不要错过 25 年春节期间的 AI 发酵:回看过去:ChatGPT 2022年底发布,2023 年春节期间发酵,节后第一波 AI 主升。2...

全家桶来了!硅基流动上线加速版 DeepSeek-R1 蒸馏模型

上线 671B 满血版 DeepSeek-R1、DeepSeek-V3 之后,今天,硅基流动 SiliconCloud 平台继续上线 6 款加速版 DeepSeek-R1 蒸馏版模型,包括 DeepSeek...

Sam 和 Ilya 的深层矛盾:有效加速主义 vs. 超级"爱"对齐

我很懒,爱写字但从不发,但因为 OpenAI 这次分裂的历史意义太大,突然把我这几个月不太理解的事情,串到了一起。所以连夜写了人生第一篇公众号。本文不讨论...

DeepSeek 三重门:小天才们,军团平推,和哲学式思想

作为相关背景从业者(北美PhD,前 Meta AI,目前AI创业),DeepSeek 带给我的震撼是巨大的。整个春节的大部分时间,我都在捧着他们的每一篇论文,一边拍大腿...

首发!数势科技大模型智能分析产品SwiftAgent全面适配DeepSeek-R1

作为行业领先的智能分析平台,数势科技SwfitAgent已全面适配DeepSeek-R1,智能分析领域迎来超强进化。在AI 时代,企业需要的不是冷冰冰的数据看板,而是能思...

惊艳!Phi-4 14B如何击败GPT-4o与o1,实现数学推理新突破?

在这个故事中,我们将深入探讨来自 Phi-4、GPT-4o 和 o1 等主要参与者的一些最新 AI 发展。2024年1月7日,微软在 Hugging Face 上发布了小型语言模...

一文搞懂DeepSeek - 混合专家(MoE)

DeepSeek推出了DeepSeek-V3,这是一个强大的混合专家(Mixture-of-Experts,MoE)语言模型,总参数量达到6710亿,每个标记(token)激活的参数量为370亿。为...

与孙正义对话,Sam Altman正面回应DeepSeek:"OpenAI投入多少,AI智能就有多强"(附视频)

【导读】就在DeepSeek以低成本模型搅动全球AI格局之际,OpenAI CEO Sam Altman与软银创始人孙正义在东京进行了一场重磅对话。在昨天这场2月3日的对话中,Altm...
1 15 16 17 18 19 52