大模型的分类及技术指标

一、大模型的分类1. 按应用领域划分 通用型大模型:适用于多种任务(如GPT系列、PaLM),具备跨领域的语言理解与生成能力。垂直型大模型:针对特定领域...

警惕“技术名词崇拜”,回归实际需求--伪AI产品盘点

真正的AI技术需同时满足自主决策、多模态交互、持续进化三大核心能力,并与硬件、场景深度耦合。识别伪AI时可重点验证其是否具备动态优化能力(如仅依赖预设...

伯克利最新研究:为什么多 Agent 系统总是“高期待、低表现”?

最近在捣鼓多 Agent 系统,但是遇到了好多坑……看了一篇伯克利的研究后非常有感触,分享给大家。伯克利的研究者们近期对多智能体系统(Multi-Agent Systems, M...

可观测性成为ML和LLM应用的最大挑战

 生产环境 ML 模型面临可观测性挑战!定制工具成主流,仅7%关注ML安全。企业纷纷试水 GenAI 和 LLM,预测分析、计算机视觉应用激增。MLOps、LLMOps、Gen...

刚刚,DeepSeek公布推理时Scaling新论文,R2要来了?

一种全新的学习方法。这会是 DeepSeek R2 的雏形吗?本周五,DeepSeek 提交到 arXiv 上的最新论文正在 AI 社区逐渐升温。当前,强化学习(RL)已广泛应用于大...

谷歌随OpenAI强势入局,劈柴4天闪电部署Gemini+MCP!

3月31日,谷歌CEO Sundar Pichai(劈柴哥)发出灵魂一问:To MCP or not to MCP, that's the question. (MCP还是不MCP,这是个问题。)MCP的持续火...

AutoGLM 发布之后,如今国产大模型终于长出了手。

本文将深入讨论:大模型深度挖掘资料的产品方案,以及作为用户,怎样用好大模型的深度挖掘能力,满足日常工作使用需求。全文阅读预计 12 分钟。主要内容:1、...

Llama4:最多2万亿参数,原生FP8的教师模型,不支持FP8的智算中心再次被暴击!!!

3个基本结论:1.llama 4 跟deepseek一样,采用原生FP8训练,不支持FP8的算力中心再次被暴击,更加坚信了我们认为下一代算力中心是FP4的技术判断《下一代智算...

咱QwQ 32B就够了?Llama4还要2000B?!

    首先结论:参数越大,模型能力越强,这个结论持续有用,scaling law 并没有失效,堆参数依然可以提高模型能力。    在AI领域,...

【AI知识点】什么是 Agentic Workflows?

最近在weaviate的博客看到一篇介绍Agentic Workflows的文章,写得非常好,介绍给大家。如果说 Agent 是行动的智能体,那 Workflows 就是它完成任务的路径。今...
1 347 348 349 350 351 536