AI资讯
接入deepseek-r1的腾讯ima,强大到我有点陌生
今天像往常一样打开腾讯的ima,发现右上角有个新版本,原来腾讯ima也接入了deepseek-r1模型。 体验了一下,真的很不错。卧槽,这个简直就是为打工人量身定...
破解 vLLM + DeepSeek 规模化部署的“不可能三角”
什么是 vLLM Cloud Native人工智能产业的蓬勃发展催生了丰富多样的推理模型,为解决特定领域的问题提供了高效的解决方案。DeepSeek 的爆火就是极佳的范例。...
用智能体复刻一个联网满血版DeepSeek-R1
最近 DeepSeek-R1 爆火后,由于用的人太多,时不时就出现无法响应的情况。现在字节的火山引擎上也提供了 DeepSeek-R1 的 API 接口,所以我们完全可以在扣子平...
第一观察丨多位DeepSeek核心成员履历曝光,中国AI人才回流势不可挡
放弃英伟达,拥抱DeepSeek,他没有一丝犹豫。近日科技媒体Rest of the World挖出了DeepSeek团队中多位核心人才的履历。在中国接受本科教育,海外深造,之后又...
Seed Research | 全新超稀疏架构,推理成本较 MoE 最高可降 83%!
随着模型规模的扩大,推理成本和访存效率已成为限制大模型规模应用的关键瓶颈。近期,字节跳动豆包大模型团队提出了全新的稀疏模型架构 UltraMem,该架构有效...
腾讯元宝全面指南手册:看完效率提升 95%
前面的文章介绍了豆包和Kimi的使用,今天继续介绍腾讯元宝,这是腾讯旗下的,实力也是非常强的。AI这是个烧钱的行业,一般小公司玩不起,头部的企业没问题,...
对话新东方优编程董事长朱宇:DeepSeek如何影响编程教育?
DeepSeek正搅动教育全行业拥抱AI,比OpenAI时期更猛烈,这让大家看到了未来教育“iPhone时刻”的曙光。近日,多知对话了新东方优编程董事长朱宇(笔名“小狼”),...
本地部署大模型?看这篇就够了,Ollama 部署和实战
写在前面前几篇,分享的都是如何白嫖国内外各大厂商的免费大模型服务~有小伙伴问,如果我想在本地搞个大模型玩玩,有什么解决方案?Ollama,它来了,专为在本...
OpenAI公布GPT 5最新路线图 以及将解除模型限制 可回答各种敏感话题,甚至是....
OpenAI CEO Sam Altman 今天在 X 上透露了 GPT-4.5 和 GPT-5 的最新发展计划。OpenAI 将发布代号为 “Orion” 的 GPT-4.5,这将是他们最后一款采用“非链式思维”...
OpenAI o1与GPT4o的对比分析
一、模型概述OpenAI o1OpenAI o1是OpenAI在2024年发布的最新模型,旨在通过深度推理和长思考时间来解决复杂问题。与之前的GPT系列模型相比,OpenAI o1更加注...