前沿科技
中国 AI 资产重估叙事
2024 年年底的时候,我看到过一些提醒,说不要错过 25 年春节期间的 AI 发酵:回看过去:ChatGPT 2022年底发布,2023 年春节期间发酵,节后第一波 AI 主升。2...
全家桶来了!硅基流动上线加速版 DeepSeek-R1 蒸馏模型
上线 671B 满血版 DeepSeek-R1、DeepSeek-V3 之后,今天,硅基流动 SiliconCloud 平台继续上线 6 款加速版 DeepSeek-R1 蒸馏版模型,包括 DeepSeek...
Sam 和 Ilya 的深层矛盾:有效加速主义 vs. 超级"爱"对齐
我很懒,爱写字但从不发,但因为 OpenAI 这次分裂的历史意义太大,突然把我这几个月不太理解的事情,串到了一起。所以连夜写了人生第一篇公众号。本文不讨论...
DeepSeek 三重门:小天才们,军团平推,和哲学式思想
作为相关背景从业者(北美PhD,前 Meta AI,目前AI创业),DeepSeek 带给我的震撼是巨大的。整个春节的大部分时间,我都在捧着他们的每一篇论文,一边拍大腿...
首发!数势科技大模型智能分析产品SwiftAgent全面适配DeepSeek-R1
作为行业领先的智能分析平台,数势科技SwfitAgent已全面适配DeepSeek-R1,智能分析领域迎来超强进化。在AI 时代,企业需要的不是冷冰冰的数据看板,而是能思...
惊艳!Phi-4 14B如何击败GPT-4o与o1,实现数学推理新突破?
在这个故事中,我们将深入探讨来自 Phi-4、GPT-4o 和 o1 等主要参与者的一些最新 AI 发展。2024年1月7日,微软在 Hugging Face 上发布了小型语言模...
一文搞懂DeepSeek - 混合专家(MoE)
DeepSeek推出了DeepSeek-V3,这是一个强大的混合专家(Mixture-of-Experts,MoE)语言模型,总参数量达到6710亿,每个标记(token)激活的参数量为370亿。为...
与孙正义对话,Sam Altman正面回应DeepSeek:"OpenAI投入多少,AI智能就有多强"(附视频)
【导读】就在DeepSeek以低成本模型搅动全球AI格局之际,OpenAI CEO Sam Altman与软银创始人孙正义在东京进行了一场重磅对话。在昨天这场2月3日的对话中,Altm...
CCF的研讨会实录:解构DeepSeek-R1!
中国计算机学会青年计算机科学与技术论坛(CCF YOCSEF)近期组织了一场研讨会,邀请了复旦大学邱锡鹏教授、清华大学刘知远长聘副教授、清华大学翟季冬教授以...
一手实测:OpenAI Deep Research
在这个测试中,会发现 Open Research 取得了较为不错的成绩,在 pass@1 和 cons@64 的标准下,均取得了比以往更好的成绩。这里做一个信息的补充,有关 pass@1...