LLM 竞赛 2025: 超越 Google 之路
「全球大模型季报」是「海外独角兽」和「张小珺商业访谈录」的 AI 领域观察栏目。以季度为单位,拾象 CEO 李广密和财经作者张小珺梳理行业 AI/LLM 领域的重要...
人工智能小白到高手:大模型通过 Function calling 沟通外部世界
1. 什么是 Function calling2. 使用场景3. 生命周期4. 是不是每个 LLM 模型都支持 Function calling 5. 通过图和代码举例说明 Function calling 过程近...
Xinference:企业级大模型推理和部署平台
导读 近年来,大语言模型(LLM,后简称大模型)的发展突飞猛进。本文将分享未来速度公司在开源领域以及大模型落地过程中的核心产品——Xinference,其定位...
DeepSeek-V3技术报告速读
DeepSeek-V3是一个强大的MoE语言模型,总参数量为671B,每个token激活37B的参数。为了实现高效的推理和具有成本效益的训练,DeepSeek-V3采用了多头潜在注意力...
Crypto+Agent的终局思考
写这篇文章时,正值2025年1月3日,这是比特币正式诞生16周年的日子。比特币开启了一个去中心化的、7*24h持续运行的、无国界的可信数字世界。但是,这个数字世...
显卡在偷懒?阿里大模型创作平台 MuseAI 极速模型切换技术提升 AI 创作效率
写在前面MuseAI 是由阿里集团爱橙科技研发的面向阿里内部的 AIGC 创作工作台,同时通过与阿里云旗下魔搭社区合作共建的形式,将主体能力通过魔搭社区的 AIGC ...
2024大模型年度概况: 信息交互、数据、LLM竞赛、Agent以及未来
第一次写主题这么大的文章,尽量整理些大而具体的信息。 01回顾互联网到AI信息分发的发展 02AI的数据问题 03 AI巨头格局,2025方向 04 ...
谷歌CEO : 大模型的低垂果实已经被摘完了,如何挖掘大模型的剩余价值?
导读 目前 LLM 模型的低垂果实已经被摘完了,接下来的技术曲线会更加陡峭。在2025年,我们将会看到差异化更加明显的团队。工程师的生产力将比以往更高。...
“卷王”豆包上桌,压力给到了谁?
大模型厂商价格战停不下来,反映的恰恰是对未来的焦虑。在这场大模型的军备竞赛中,豆包想要上演“大力出奇迹”的戏码。”@科技新知 原创作者丨思原 ...
从0到1构建RLHF系统——小红书大模型团队的探索与实践
在人工智能技术的快速发展中,多模态大语言模型(MLLM)以其强大的图文理解、创作、知识推理及指令遵循能力,成为了推动数字化转型的重要力量。然而,如何使...