AI资讯
8块A100,32B碾压DeepSeek V3、o1-preview!普林斯顿北大首提分层RL推理
仅用8块A100,训出的32B模型,数学性能直接反超o1-preivie?!看来,小模型真的要逆天改命了……近日,来自普林斯顿和北大的华人团队基于一种创新性的「分层LLM...
DeepSeek-V3 高效训练关键技术分析
前言今年春节 DeepSeek-V3&R1 对国内外 AI 圈产生了巨大的影响,其本质在于开拓了一条不同于 OpenAI 训练方法的道路,证明了通过模型架构和训练方法的极...
“阿里是当下苹果最好的选择,甚至可能没有之一”
就在人们还对马云突然现身阿里杭州园区津津乐道的时候,苹果突然被爆将与阿里巴巴合作为中国 iPhone 用户开发人工智能功能。根据 The Information 的消息,有...
联网版满血DeepSeek的正确打开方式,R1还能自定义
大家知道,国内部署 DeepSeek 模型的有多少家了吗?截止到2月10号,已经有65家支持R1,如果说之前是想用 R1 的人太多,卡顿用不上,那现在就是选择太多,不...
Claude 4要来了?Anthropic发布38页经济指数报告,43%人类工作正被AI取代!
Claude 3.5 Opus无了,Anthropic本周可能会提前放出Claude 4。网友爆料称,除了Claude 4,还有推理模型也将首亮相,评分全面超越o3。Anthropic已经沉寂太久了...
DeepSeek的横空出世早有“先兆”
这个春节,DeepSeek 让 AI 再次站在了全民瞩目的聚光灯下。据说 DeepSeek-V3 只花了 550 万,效果就超过了 Meta 的 Llama4,差不多是 Meta 的 1/30。用极低的...
DeepSeek让多地智算中心停建?业界总结回应七点
最近有文章称“DeepSeek让多地智算中心停建”,但不少业内人士并不认同。春节之后,不少企业,尤其是上市公司,都正在接入DeepSeek。未来几个月将是应用验证期...
腾讯落子,AI 后手入场
今年初,腾讯AI助手应用“元宝”已经完成了组织调整,产品团队从TEG事业群(技术工程事业群)调整至CSIG(云与智慧产业事业群)。调整后,“元宝”应用将交由腾讯...
教你本地复现Deep Research:DeepSeek R1+ LangChain+Milvus
金融机构、律所、科研党的福音来了!不久前,OpenAI 新推出了一项名叫 Deep Research(深度研究) 的功能,迅速风靡全球。我们可以将其理解为大模型+超级搜索...
对不起,o3都出了我才搞明白GPT4o和o1的区别
很久没有更新了,但我还在学习。只是进度非常非常的慢。这不是一篇科普也不是我的什么模型体验报告。算是一篇学习笔记吧,好记性不如烂笔头。很多东西不写下...