AI资讯
Qwen2.5-Max全面拥抱DeepSeek技术路线
人们普遍认为Scaling Law(缩放定律)是一种通向 AGI 的可能的路径,即持续扩大数据规模和模型规模可以显著提升模型的智能水平。然而,无论是密集模型还是专...
DeepSeek让所有人都变成了Perplexity
作者|周一笑邮箱|zhouyixiao@pingwest.comDeepSeek继续改变着过去几年形成的AI格局。 早在2024年5月,DeepSeek-V2就凭借GPT-4的百分之一的价格,被称作“价...
一口气输出有用的3万字,Gemini绝对是世界上最勤奋的AI,比 DeepSeek 还好用
DeepSeek最近火得不行, 但江树发现了个更猛的... 你有没有这样的困扰: 每次想用AI润色一篇长文本,都要反复复制、粘贴、等待、再复制、再粘贴... 处理一篇...
接入deepseek-r1的腾讯ima,强大到我有点陌生
今天像往常一样打开腾讯的ima,发现右上角有个新版本,原来腾讯ima也接入了deepseek-r1模型。 体验了一下,真的很不错。卧槽,这个简直就是为打工人量身定...
破解 vLLM + DeepSeek 规模化部署的“不可能三角”
什么是 vLLM Cloud Native人工智能产业的蓬勃发展催生了丰富多样的推理模型,为解决特定领域的问题提供了高效的解决方案。DeepSeek 的爆火就是极佳的范例。...
用智能体复刻一个联网满血版DeepSeek-R1
最近 DeepSeek-R1 爆火后,由于用的人太多,时不时就出现无法响应的情况。现在字节的火山引擎上也提供了 DeepSeek-R1 的 API 接口,所以我们完全可以在扣子平...
第一观察丨多位DeepSeek核心成员履历曝光,中国AI人才回流势不可挡
放弃英伟达,拥抱DeepSeek,他没有一丝犹豫。近日科技媒体Rest of the World挖出了DeepSeek团队中多位核心人才的履历。在中国接受本科教育,海外深造,之后又...
Seed Research | 全新超稀疏架构,推理成本较 MoE 最高可降 83%!
随着模型规模的扩大,推理成本和访存效率已成为限制大模型规模应用的关键瓶颈。近期,字节跳动豆包大模型团队提出了全新的稀疏模型架构 UltraMem,该架构有效...
腾讯元宝全面指南手册:看完效率提升 95%
前面的文章介绍了豆包和Kimi的使用,今天继续介绍腾讯元宝,这是腾讯旗下的,实力也是非常强的。AI这是个烧钱的行业,一般小公司玩不起,头部的企业没问题,...
对话新东方优编程董事长朱宇:DeepSeek如何影响编程教育?
DeepSeek正搅动教育全行业拥抱AI,比OpenAI时期更猛烈,这让大家看到了未来教育“iPhone时刻”的曙光。近日,多知对话了新东方优编程董事长朱宇(笔名“小狼”),...