前沿科技

“卷王”豆包上桌,压力给到了谁?

大模型厂商价格战停不下来,反映的恰恰是对未来的焦虑。在这场大模型的军备竞赛中,豆包想要上演“大力出奇迹”的戏码。”@科技新知 原创作者丨思原 ...

从0到1构建RLHF系统——小红书大模型团队的探索与实践

在人工智能技术的快速发展中,多模态大语言模型(MLLM)以其强大的图文理解、创作、知识推理及指令遵循能力,成为了推动数字化转型的重要力量。然而,如何使...

喜迎2025,AI Agent技术栈全解析!

你是否也曾好奇,那些能自主执行任务、调用工具的 AI “agent” 是如何运作的? 2024 年,我们见证了 AI 技术从简单的聊天机器人向更复杂的智能体转变。但...

4o-mini只有8B,o1也才300B!微软论文意外曝光GPT核心机密

微软又把OpenAI的机密泄露了??在论文中明晃晃写着:o1-preview约300B参数,GPT-4o约200B,GPT-4o-mini约8B……‍英伟达2024年初发布B200时,就摊牌了GPT-4是1....

年终长文15000字:学习的终结(The End of Learning)——从ChatGPT到未来

摘要在历史长河的一隅,从远古时代祖先传承火种的教导,到现代互联网无垠知识的星辰大海,学习一直是人类不可或缺的生存技巧。然而,“头悬梁锥刺股”“十年寒窗...

2024年度总结:我们用Chat2API的最后一行代码开启AI Agent之年

引子我们相信在AI时代,Agent将像工业革命时期的机器一样无处不在。对Agent来说,学会使用工具就像人类使用工具一样重要。经过云原生时代的积累,这些工具一...

惊喜!Sam Altman确定OpenAI新产品,AGI、Agents、成人模式

今天凌晨3点30,Sam Altman公布了2025年OpenAI即将发布的技术产品。分别是:AGI(通用人工智能)、Agents(智能体)、更好的GPT-4o升级版、更好的记忆存储、...

DeepSeek甩出了一张“王炸”

12月26日消息,国产大模型DeepSeek推出DeepSeek-V3,一个强大的混合专家(Mixture-of-Experts, MoE)语言模型。主要的技术迭代是671B的MoE,37B的激活参数,...

万字长文:汇总最全的Agent技术与应用现状及前景分析

在人工智能的浩瀚宇宙中,Agent技术正以其独特的光芒吸引着全球科技界的瞩目。Agent,或称为智能代理,是一种能够感知环境、做出决策并执行动作的人工实体。...

Colossal-AI: AI 大模型的挑战与系统优化

导读 本次分享阐述了大模型时代对于分布式训练的挑战,在分布式算法、异构存储等方面存在的业界难题,并提出了相应的优化解决方案。推出了“Colossal-AI”...
1 33 34 35 36 37 52