增强大模型的推理能力:从思维链到连续思维链(中)
5语言模型进行推理的底层逻辑 前面我们提到,大模型回答问题有两种场景:一种是提示词上下文中没有“解题思路”的提示,也没有“让我...
2024年全年,大模型中标项目被谁拿走了?
智能超参数今天发布《中国大模型中标项目监测报告(2024)》系列文章的第二篇,盘点一下2024年全年,大模型中标项目都被谁拿走了。上周五我们公布了市场的整体...
OpenAI CEO:一路坎坷,但AGI就在前方
序言:在这个科技快速发展的时代,人工智能的步伐愈加引人注目。OpenAI CEO在最新的博客中,以独特的视角回顾了公司九年来的成长历程,以及人工智能领域的巨...
构建智能未来:Google AI 智能体白皮书
本文深入探讨了生成式 AI 智能体的核心组件、工作原理、关键技术及其广泛应用。从智能体的定义到模型、工具和编排层的协同作用,再到认知架构的运作机...
谷歌刚刚发布 AI Agent 白皮书,2025 年agent时代已开启
人类非常擅长复杂的模式识别任务。他们在得出结论之前经常依赖工具——如书籍、谷歌搜索或计算器——来补充他们的先验知识。就像人类一样,生成式人工智能模型可...
极客说|微软新模型:Phi-4 来了
Phi-4 在仅有 140 亿(14B) 个参数的情况下,通过创新的训练方法和高质量的数据,展现出了媲美甚至超越一些更大规模模型的性能。本文将详细介绍 Phi-4 ...
LLM 竞赛 2025: 超越 Google 之路
「全球大模型季报」是「海外独角兽」和「张小珺商业访谈录」的 AI 领域观察栏目。以季度为单位,拾象 CEO 李广密和财经作者张小珺梳理行业 AI/LLM 领域的重要...
人工智能小白到高手:大模型通过 Function calling 沟通外部世界
1. 什么是 Function calling2. 使用场景3. 生命周期4. 是不是每个 LLM 模型都支持 Function calling 5. 通过图和代码举例说明 Function calling 过程近...
Xinference:企业级大模型推理和部署平台
导读 近年来,大语言模型(LLM,后简称大模型)的发展突飞猛进。本文将分享未来速度公司在开源领域以及大模型落地过程中的核心产品——Xinference,其定位...
DeepSeek-V3技术报告速读
DeepSeek-V3是一个强大的MoE语言模型,总参数量为671B,每个token激活37B的参数。为了实现高效的推理和具有成本效益的训练,DeepSeek-V3采用了多头潜在注意力...