AI资讯

Ray Summit 2024 亮点抢先看!蚂蚁分布式 AI Agent 框架首次亮相!

2024 年 9 月 30 日-10 月 2 日,Ray Summit 2024 将在美国旧金山举行。作为 Ray 社区的年度盛会,今年 Ray Summit 的主题是“Where Builders Create the AI F...

大模型直接预测下一个句子,更快、更准、更长!

近日,ArXiv上一篇名为《SentenceVAE:Enable Next-sentence Prediction for Large Language Models with Faster Speed, Higher Accuracy and Longer Context...

大模型成本效益对比:DeepSeek 2.5 VS Claude 3.5 Sonnet VS GPT-4o

与Claude和GPT模型相比,DeepSeek模型过去一度被开发者社区忽视。不过,过去几个月以来,DeepSeek的发展势头非常迅猛。随着DeepSeek 2.5发布(该版本整合了De...

从 ASI到 AHI,人类与AI共生的发展之路

人工智能(AI)自其诞生以来,经历了数十年的发展,从最初的简单算法到如今复杂的深度学习模型,AI技术已经深刻影响了各个领域。早期的AI系统主要依赖于规则...

上下文不够长?来试试MemLong

摘要近年来,大型语言模型(LLMs)在各个领域取得了显著的成功。然而,由于时效性、Attention 机制内存消耗等问题,处理长上下文仍然是 LLMs 的一个重大挑战...

大模型与社会分工,产业链与模块化

“ 分工才是社会进步的动力,大模型产业链才刚刚开始 ”可能很多人看了标题会觉得很奇怪,大模型与社会分工有什么关系,产业链和模块化又是什么鬼,...

OpenAI o1如何炼成?原理逆向工程图解

“ OpenAI o1 出现后,大家都在研究它,这里给大家带来知乎@张俊林大佬的文章,这里是他对 o1 的理解。除了复杂逻辑推理能力获得极大增强,o1还有其它什...

Llama 3.2:通过开放、可定制的模型彻底改变边缘人工智能和视觉

1. Llama 3.2 模型简介1.1 模型类别包括小型和中型视觉模型(11B 和 90B)以及轻量级文本模型(1B 和 3B),适用于边缘设备和移动设备。1.2 创新点视觉模型创...

OpenAI CEO万字长文——智能时代

近日,OpenAI CEO 山姆·奥特曼发表了一篇长文博客,标题为《智能时代》(The Intelligence Age)。文末附总结。以下是山姆·奥特曼全文:在接下来的几十年里,...

首发!大模型可信增强,渊亭科技推出KGAG框架平台

在当今这个信息爆炸的时代,大模型技术以其强大的数据处理能力和广泛的应用场景,成为了人工智能领域的一颗璀璨明珠。然而,伴随着大模型的广泛应用,一些问...
1 515 516 517 518 519 596