前沿科技
LalaEval:面向领域大模型的端到端人工评测框架
痛点企业如何构建适合自己领域的大模型?如何灵活地根据业务需要来生成评测集,进而充分发挥企业内部数据的价值?如何通过标准化人工评测流程来减少人工的主...
OpenAI重磅:全新自主Agent意外曝光!
惊人的性能数据在「Operator System Card Table」中,这个神秘的AI Agent在浏览器操作中拿下了87.0%的高分,远超Claude 3.5 Sonnet的56.0%和Google Mariner的...
突发!OpenAI宣布“星际之门计划”:5000 亿美元构建未来 AI 基础设施
刚刚!OpenAI 宣布了一项雄心勃勃的计划——“星际之门计划”(The Stargate Project),旨在未来四年内投资 5000 亿美元在美国建立新的 AI 基础设施。该计...
中国研究者破解OpenAI 01和03的“思考”秘密,AGI时代即将到来?
从“思考模型”到AGI,OpenAI和Google的“测试时间计算”如何让AI达到博士级水平?近年来,人工智能领域迎来了前所未有的突破,尤其是OpenAI的01和03模型,...
Cohere Design: 顶尖 AI 团队的绝佳审美
开篇:顶尖 AI 团队的审美突围在当今 AI 领域,技术实力往往是人们关注的焦点,审美设计常常被忽视或趋同。然而,作为大模型领域的顶尖团队,Cohere 不仅在技...
Google DeepMind 也要开始研究世界模型
Google DeepMind 正在组建一个专门的 AI 研究人员团队来构建“世界模型”,即物理环境的高级模拟,旨在支持游戏、机器人等领域的各种应用。该团队将由 OpenAI ...
DeepSeek-R1:开启大语言模型推理能力强化学习新纪元
在人工智能领域,大语言模型(LLMs)的迭代速度令人惊叹,从 Anthropic 的 Claude 到 Google 的 Gemini,再到 OpenAI 的 GPT 系列,AI 正在以前所未有...
腾讯搜索广告:基于混元大模型的生成式召回探索与应用
摘要大语言模型(Large Language Model,LLM [1])具有完备的世界知识,通过有监督指令微调和人类反馈强化学习[2]的加持,自然语言精准理解和推断能力得到极大...
豆包实时语音大模型上线即开放!情商智商双高
豆包实时语音大模型于今日正式推出,并在豆包 APP 全量开放,将豆包 APP 升级至 7.2.0 版本即可体验。豆包实时语音大模型,是一款语音理解和生成一体化的模型...
几十个测试后,发现海螺语音与 ElevenLabs 掰手腕的能力不是盖的
试想一个场景,职场中接到一个香港客户的单子,但是在交付的过程中耽搁了时间,现在要进行线上沟通解释,那么你面对的情况大致是这样的:如果不对这段音频进...