加速推理6.4倍!Meta发布多Token推理框架

一、当前LLM训练和推理遇到了哪些瓶颈 训练效率低下:传统的LLMs训练依赖于下一个Token的预测损失,但这种方法在推理能力方面存在效率低下的问题。推理能力有...

详解大模型应用可观测全链路

阿里妹导读阿里云可观测解决方案从几个方面来尝试帮助使用 QwQ、Deepseek 的 LLM 应用开发者来满足领域化的可观测述求。一、背景近日,随着阿里通义千问推出...

百度智能云黄锋:从企业视角如何运用大模型应用开发平台

摘要:大模型应用时代为企业提供了更多场景,但技术本身还是服务于最终创造出来的应用价值。如何在控制成本的基础上获得最好的效果性能是企业需要解决的核心...

【1分钟科普】基于大模型(如DeepSeek)的智能体技术:AI Agent

      如今,“大模型(如DeepSeek)”和“智能体”正改变着越来越多企业的生产方式。但对于很多非专业朋友来说,这些概念听上去既神秘又复杂。其实,它们的核心...

数据库 + 大模型,DBA初级变高级?

数据库 + 大模型,是这两年比较火的一个话题。例如早前的 AIOps 智能运维,通过融合 AI 技术,尤其是机器学习和大数据分析方面,试图提升 IT 运维效率与自动...

AI大模型创业之旅的第一周感想

AI大模型确实火,客户商机太多了首先,从企业内部来看,AI大模型是企业为数不多还有预算增长的领域。很多头部企业缩减了headcount、缩减了营销预算,但是AI相...

DeepSeek技术全景解析

摘要:文档由智研咨询发布,围绕 DeepSeek 展开多方面分析,探讨其在 AI 行业的地位与影响。报告分析了其企业背景、模型家族、技术创新、商业模式、应用场景...

从大数据到大模型:现代应用的数据范式

本文简介:在大数据和大模型的加持下,现代数据技术释放了巨大的技术红利,通过多种数据范式解除了数据的桎梏,使得应用程序达到了“心无桎梏,身无藩篱”的自...

DeepSeek在企业侧的落地:技术盘点与路径解析

DeepSeek的崛起不仅是技术革新,更是一场从“机器语言”到“人类语言”的范式革命,推动了AGI时代到来。各个行业的应用场景不断拓展,为企业数字化发展带来了新机...

周枫:教育大模型16个月落地思考

去年7月,有道发布了“子曰” 教育大模型。时至今日,已过去16个月。在这段时间里,“子曰” 化身虚拟人,走进课堂,还植入了硬件设备。有成功,亦有失败。然而,...
1 382 383 384 385 386 503