AI资讯
中国研究者破解OpenAI 01和03的“思考”秘密,AGI时代即将到来?
从“思考模型”到AGI,OpenAI和Google的“测试时间计算”如何让AI达到博士级水平?近年来,人工智能领域迎来了前所未有的突破,尤其是OpenAI的01和03模型,...
Cohere Design: 顶尖 AI 团队的绝佳审美
开篇:顶尖 AI 团队的审美突围在当今 AI 领域,技术实力往往是人们关注的焦点,审美设计常常被忽视或趋同。然而,作为大模型领域的顶尖团队,Cohere 不仅在技...
Google DeepMind 也要开始研究世界模型
Google DeepMind 正在组建一个专门的 AI 研究人员团队来构建“世界模型”,即物理环境的高级模拟,旨在支持游戏、机器人等领域的各种应用。该团队将由 OpenAI ...
DeepSeek-R1:开启大语言模型推理能力强化学习新纪元
在人工智能领域,大语言模型(LLMs)的迭代速度令人惊叹,从 Anthropic 的 Claude 到 Google 的 Gemini,再到 OpenAI 的 GPT 系列,AI 正在以前所未有...
腾讯搜索广告:基于混元大模型的生成式召回探索与应用
摘要大语言模型(Large Language Model,LLM [1])具有完备的世界知识,通过有监督指令微调和人类反馈强化学习[2]的加持,自然语言精准理解和推断能力得到极大...
豆包实时语音大模型上线即开放!情商智商双高
豆包实时语音大模型于今日正式推出,并在豆包 APP 全量开放,将豆包 APP 升级至 7.2.0 版本即可体验。豆包实时语音大模型,是一款语音理解和生成一体化的模型...
几十个测试后,发现海螺语音与 ElevenLabs 掰手腕的能力不是盖的
试想一个场景,职场中接到一个香港客户的单子,但是在交付的过程中耽搁了时间,现在要进行线上沟通解释,那么你面对的情况大致是这样的:如果不对这段音频进...
Z Product|ChatGPT Voice之父离职创办语音模型公司,种子轮即获a16z 4000万美金,估值数亿美元
Z HighlightsWaveForms致力于开发音频大模型(LLMs),通过创新的端到端音频处理技术,实现更加实时、类人化且情感智能化的语音交互。与传统语音模型不同,Wa...
图解 AI Agent: 从理念到实现
前言当我们讨论 AI 发展时,不得不提到最令人振奋的方向之一:AI Agent。它代表了一种全新范式,不同于传统的机器学习模型,AI Agent 展现出了惊人的自主性和...
AI算法之“人工智能”总结笔记
本文是投喂ai大模型的总结,以听、说、看、思考创造角度列举的典型的AI算法和场景,如有分类不正确,那说明ai仍需努力,哈哈哈~1. 计算机视觉(CV)核心算法...