从DeepSeek MoE专家负载均衡谈起

上周中的时候, 同事给我了一份线上DeepSeek-R1推理的Expert激活的数据用来研究一些专家负载均衡的算法, 当然这些线上数据来自于公司内部的请求, 从中观测出前...

AI大模型应用需要解决的八大矛盾

这一年多来,AI大模型如火如荼地涌向千行百业,但它在实际应用中面临着一系列矛盾和挑战。这些矛盾不仅涉及技术层面,还涉及经济、社会和伦理等多个维度。例...

Manus爆火的背后,Agentic AI产品如何构筑持久的竞争优势?

原文:https://yage.ai/manus.html    最近,Manus发布并迅速火遍了中文互联网。在深度使用了Manus以后,我觉得这个产品确实充满了启发。它抓住了Agentic AI...

零一万物 ToB 解决方案正式发布,听听百胜中国、孩子王等头部企业怎么说|FM 01.AI

近日,零一万物对外披露了基于 Yi 模型构建的包含零售行业解决方案、模型训练解决方案、智算中心解决方案在内的一整套大模型 ToB 解决方案。其中,分属“零售...

深度解析 DeepFlow 如何采集大模型服务的业务指标

为高质量支撑 2024 年客服大模型商用,中国移动构建了客服大模型“混合云”生产环境,确保大模型应用安全稳定运行、智算资源高效利用。面对当前跨云调用拓扑的...

老板格局不大,但编码能力不错的Claude 3.7正式发布

谁是真正的王者?北京时间凌晨三点,老板格局不大,但编码能力不错的Anthropic扔出AI领域的重磅炸弹——正式发布全球首个混合推理大模型Claude 3.7 Sonnet, 同...

经济学人:OpenAI不会一直是微软囚禁的鸟

这堪称是文艺复兴时期赞助人制度的现代版本。自2019年以来,微软已向OpenAI提供了超过130亿美元的现金和计算能力支持。OpenAI曾是一家一贫如洗的初创公司,如...

LLM-Agent 用户界面:以人为中心的界面设计

近年来,大型语言模型(LLM)在各个领域的应用得到了广泛关注,尤其是在用户交互和工具操作上,LLM的潜力正逐步显现。本文基于《Human-Centered LLM-Agent Us...

AI 2.0时代,谁是未来的“掘金者”和“卖铲人”?

ChatGPT横空出世、Sora对世界的理解能力、商汤“日日新SenseNova”落地多个实际场景……都在告诉我们:AGI的大门已经打开!人们飞快地达成AGI时代要来临的共识,A...

一文让你彻底了解「AI互联互通的标准MCP」

昨天介绍了 Manus AI智能体,而要构建出有效的智能体,就不得不用MCP。什么是MCP?MCP就是Model Context Protocol(模型上下文协议)的缩写。作为一项由Anthrop...
1 385 386 387 388 389 502