前沿科技

LLM沉思:无监督学习的理论基础是啥?

引言  有没有好奇过:LLM背后的数学原理是啥?OpenAI前首席科学家 Ilya提供了一种理论解释。(1)Ilya 是谁?全名Ilya Sutskever,深度学习教...

Agent技术解读:Planning(规划)模块

引言  继续介绍Agent系统中另一个核心组件:规划,Planning去年的Agent综述文章《大模型智能体 LLM Agent》提到了:Agent是大模型与场景间价...

OpenAI o1深夜炸场,核心贡献者有哪些?我们看到了大量华人的名字

这篇文章系统梳理了 OpenAI o1模型背后的核心人才。今天凌晨,OpenAI 震撼发布 o1 大模型,酝酿已久的「草莓」终于面世。新模型能够进行复杂推理,具备真正的...

AI 云计算巨头Snowflake CEO专访:DeepSeek是好模型,而ChatGPT是一款好产品

企业数据领域,Databricks 和 Snowflake 是目前主要的竞争选手。Databricks 目前是全球估值最高的初创公司之一,而 Snowflake 是一家市值 600 亿美元的上市公...

OpenAI o1 技术解读:通往 AI 心智迷宫的地图

OpenAI o1 技术解读:通往 AI 心智迷宫的地图引言近年来,大型语言模型(LLM)在自然语言处理领域取得了显著的进展,其强大的文本生成、翻译、问答等能力令人...

解读OpenAI Sora文生视频技术原理

OpenAI Sora文生视频(图像看作单帧视频)一放出就炸翻整个AI 圈,也是ChatGPT掀起GenAI热潮时隔一年后,OpenAI再次史诗级的更新。OpenAI 随后公布的技术综述...

实测Claude 3.7:3200行代码一口气输出,物理规律手拿把掐,弱智吧已失守

克雷西 一水 发自 凹非寺量子位 | 公众号 QbitAI Claude 3.7新鲜出炉全网热议,到底有多强? 第一波实测来了!简单粗暴总结,它在编程、现实世界任务上,能力...

如何提升大模型推理能力

一.大模型的推理能力现在的大模型是茶壶里煮饺子,从预训练中学习了很多,但简单粗暴的采样推理的方式却限制了它的能力输出。         ...

Claude 新模型一手实测:朴素,强大,与艺术之美

  昨天凌晨,Anthropic 发布了 Claude 3.7 Sonnet。在代码能力方面,根据测评结果, 3.7 Sonnet 遥遥领先于其前代模型,以及 GPT-o1 和 o3-mini-high: 忍不...

OpenAI震撼发布o1大模型!RL深度思考,技术差距拉开

openai放大招了,是奥特曼在推上宣传了很久的草莓真身,这次它真的来了。又给大家带来一点小小的震撼,国内大模型老板们也不再迷茫了,4o的多模态的还没赶上...
1 529 530 531 532 533 596