前沿科技

谷歌版o1突发即屠榜!思考速度比所有模型快5倍,能解摩斯代码,数学物理秒秒钟解决

谷歌版o1来了!在奥特曼“双十二”倒数第二天——他们发布Gemini 2.0 Flash Thinking,顾名思义,以闪电般的速度解决复杂问题并展示其思考过程的实验模型。从姐夫...

极简开发,极速上线:构建端到端大模型应用

前言随着大模型技术的迅猛发展,各行业正迎来 AI 应用创新的黄金时代。大模型作为核心引擎,正在重塑传统应用的开发模式和应用架构。无论是个体还是企业开发者...

大模型落地,苦「最强」久矣

没有刷不了的榜,只有还没 over-fitting 的数据集;没有搞不定的第一,只有还没加够 XX 领域,XX 尺寸,XX 语言的限定词。尽管自 2012 年深度学习复苏之日起...

吴恩达最新访谈——人工智能视觉、Agent智能体和商业价值

吴恩达(Andrew Ng)是全球知名的人工智能专家和教育家,斯坦福大学计算机科学与电气工程系副教授,曾任Google Brain团队创始成员之一,并是在线教育平台Cour...

Sakana AI推出LLM记忆管理技术NAMMs,可将内存成本降低75%

记忆是认知的关键组成部分,让人类能够从充斥我们生活的无尽噪音中选择性存储和提取重要信息。相比之下,大语言模型(Large Language Model,LLM)则缺乏这种...

云原生 AI:打造大模型工程化落地的最佳实践

一、云原生与 AI 的结合自 2022 年 11 月 OpenAI 发布 ChatGPT 以来,AI 加速融入实际应用的进程日益加快。伴随着 AI 需求的增多,加快日常迭代对于 AI 厂商...

Meta推出全新AI模型Apollo了

Meta公司对开源模型有着重要的贡献,但行业外的人说到人工智能,知道 OpenAI 的会更多一点。看我文章的朋友应该还记得,之前写过一篇《LLAMA 3.1 405B》推文...

小试牛刀|试用 DB-GPT x OceanBase 构建自给自足的 Chat Data 应用

本文通过DB-GPT搭建了一个Chat Data with OceanBase的应用,通过DB-GPT的编排能力在一定程度上提升了OceanBase数据库的易用性,且步骤十分简单,推荐所有Ocea...

大模型量化技术原理:QoQ量化及QServe推理服务系统

近年来,随着Transformer、MOE架构的提出,使得深度学习模型轻松突破上万亿规模参数,从而导致模型变得越来越大,因此,我们需要一些大模型压缩技术来降低模...

顶级人工智能 Gemini 2.0 Flash 开发人员入门指南

Gemini 2.0 已经到来,带来了为这个新代理时代构建的下一代能力。Gemini 2.0 Flash 现在可以通过 Vertex AI Gemini API、Vertex AI Studio、Google AI S...
1 40 41 42 43 44 51