AI资讯
白话科普 | DeepSeek的蒸馏技术到底是什么?90%的人都没搞懂,但西方却抓着不放!
引言:AI领域的“炼金术”——模型蒸馏在人工智能领域,大型语言模型(LLM)无疑是近年来最耀眼的技术突破之一。然而,这些拥有数百亿甚至上千亿参数的庞然大物,...
为什么DeepSeek要把思考过程展示出来?
和别的AI大模型不一样,别的都是直接输出答案,而deepseek会把思考过程展示给用户。那么DeepSeek把思考过程展示出来,原因是什么呢? 提升用户信任度&nb...
R1比R1-ZERO更重要-深度探索公司R1-ZERO和R1的分析
特别感谢Tuhin和Abu来自Baseten,以及Yuchen来自Hyperbolic Labs为我们托管r1-zero。几乎没有任何提供商托管这个模型变体,其可用性对于研究至关重要。ARC Pr...
OpenAI o3-mini 发布,官方 System Card 说了啥?
“ OpenAI o3-mini 通过大规模强化学习和链式思考,显著提升了模型的推理能力和安全性,同时在多语言、代码生成和推理能力上表现出色。在安全性方面,尽...
顺丰科技:多智能体系统(OpenAI Swarm)的可观测性研究与实践
导读 本文将介绍一个具有研究性质的主题,关于多智能体系统(Multi-Agent System)的可观测性研究。目前,我们的工作主要基于 OpenAI 于上个月开源的名...
7个原因解析:DeepSeek如何仅用5%预算就能超越OpenAI?
在AI领域,高昂的研发和运营成本一直是行业痛点。然而,DeepSeek(DeepSeek-V3 深度剖析:下一代 AI 模型的全面解读)以惊人的效率打破了这一桎梏——仅用OpenA...
打不过就加入?DeepSeek R1率先上架英伟达NIM平台,全球AI发展趋势大洗牌?
引言:AI大模型时代的范式重构2025年1月31日,英伟达网站显示,DeepSeek R1 671b已作为英伟达NIM微服务预览版在build.nvidia.com上发布。DeepSeek R1 NIM微服...
OpenAI CEO 认怂:优势被 DeepSeek 削弱,将重新制定开源战略
在周五的 Reddit 问答活动中,OpenAI 首席执行官山姆·阿尔特曼携研究团队与高管们回应了系列尖锐提问。这家身处逆境的 AI 巨头正面临多重挑战:既要应对中国...
被DeepSeek卷到了!Sam Altman首次承认OpenAI的闭源策略“站在了历史错误的一边”|甲子光年
北京时间2月1日凌晨,OpenAI正式发布o3-mini,这是OpenAI推理系列中最新、最具成本效益的模型,已在ChatGPT和API中开放使用。这可以看作OpenAI对过去一周多风...
Falcon 3:阿联酋技术创新研究所推出世界上最小、最强大的人工智能模型
.01概述近年来,大型语言模型(Large Language Models,LLMs)的发展成为人工智能领域的核心议题。而作为这一领域的先行者之一,位于阿布扎比的科技创新研究...