AI资讯

Qwen2.5-Max全面拥抱DeepSeek技术路线

人们普遍认为Scaling Law(缩放定律)是一种通向 AGI 的可能的路径,即持续扩大数据规模和模型规模可以显著提升模型的智能水平。然而,无论是密集模型还是专...

DeepSeek让所有人都变成了Perplexity

作者|周一笑邮箱|zhouyixiao@pingwest.comDeepSeek继续改变着过去几年形成的AI格局。 早在2024年5月,DeepSeek-V2就凭借GPT-4的百分之一的价格,被称作“价...

一口气输出有用的3万字,Gemini绝对是世界上最勤奋的AI,比 DeepSeek 还好用

DeepSeek最近火得不行, 但江树发现了个更猛的... 你有没有这样的困扰: 每次想用AI润色一篇长文本,都要反复复制、粘贴、等待、再复制、再粘贴... 处理一篇...

接入deepseek-r1的腾讯ima,强大到我有点陌生

  今天像往常一样打开腾讯的ima,发现右上角有个新版本,原来腾讯ima也接入了deepseek-r1模型。 体验了一下,真的很不错。卧槽,这个简直就是为打工人量身定...

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

什么是 vLLM Cloud Native人工智能产业的蓬勃发展催生了丰富多样的推理模型,为解决特定领域的问题提供了高效的解决方案。DeepSeek 的爆火就是极佳的范例。...

用智能体复刻一个联网满血版DeepSeek-R1

最近 DeepSeek-R1 爆火后,由于用的人太多,时不时就出现无法响应的情况。现在字节的火山引擎上也提供了 DeepSeek-R1 的 API 接口,所以我们完全可以在扣子平...

第一观察丨多位DeepSeek核心成员履历曝光,中国AI人才回流势不可挡

放弃英伟达,拥抱DeepSeek,他没有一丝犹豫。近日科技媒体Rest of the World挖出了DeepSeek团队中多位核心人才的履历。在中国接受本科教育,海外深造,之后又...

Seed Research | 全新超稀疏架构,推理成本较 MoE 最高可降 83%!

随着模型规模的扩大,推理成本和访存效率已成为限制大模型规模应用的关键瓶颈。近期,字节跳动豆包大模型团队提出了全新的稀疏模型架构 UltraMem,该架构有效...

腾讯元宝全面指南手册:看完效率提升 95%

前面的文章介绍了豆包和Kimi的使用,今天继续介绍腾讯元宝,这是腾讯旗下的,实力也是非常强的。AI这是个烧钱的行业,一般小公司玩不起,头部的企业没问题,...

对话新东方优编程董事长朱宇:DeepSeek如何影响编程教育?

DeepSeek正搅动教育全行业拥抱AI,比OpenAI时期更猛烈,这让大家看到了未来教育“iPhone时刻”的曙光。近日,多知对话了新东方优编程董事长朱宇(笔名“小狼”),...
1 7 8 9 10 11 51