前沿科技

万字长文详解DeepSeek核心技术

?目录 1 DeepSeek 系列模型的技术创新     1.1 DeepSeek MoE 架构     1.2 群体相对策略优化(Group Relative Policy Optimization,GRPO)     1.3 多头隐...

深度体验微信版R1三天后,这版DeepSeek的五个缺点被我挖出来了

今天上午一看, 腾讯市值暴涨3000亿登上热搜 Top1。 涨幅6.6%,是2021年7月以来的最高水平。意料之中,也在意料之外。 我是真没想到,在各家都还在陆陆续续接...

腾讯产品疯狂接入DeepSeek,哪个最好用?| AI新榜实测

作者|石濑 阿虎 编辑|张洁 谁能想到,最先接入DeepSeek的互联网大厂当家产品,是一向以“克制”著称的微信。2月15日,微信正式灰度测试接入DeepSeek。而这距...

攻破AI最强守卫,赏金2万刀!Anthropic新方法可阻止95% Claude「越狱」行为

  新智元报道   编辑:KingHZ【新智元导读】Anthropic,公布了新的AI模型防护方法,在之后约48小时内,无人完全攻破新系统,将赏金提高到了最高2万美元。新方...

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

什么是 vLLM人工智能产业的蓬勃发展催生了丰富多样的推理模型,为解决特定领域的问题提供了高效的解决方案。DeepSeek 的爆火就是极佳的范例。然而,对于个人...

多维表+DeepSeek 们的终极用法,都在这了

钉钉多维表是新一代业务管理与协作工具。 通过一张表,用户可以实现在线协作、业务管理、数据可视化等多种需求,构建出专属且个性化的应用系统。 在钉钉,AI ...

DeepSeek团队新作:把代码变成思维链,大模型推理各种能力全面提升

克雷西 发自 凹非寺量子位 | 公众号 QbitAI 用代码训练大模型思考,其他方面的推理能力也能提升。 DeepSeek团队最新研究,利用300多万个实例,将代码转换成思...

谈谈DeepSeek-v3提到的基础设施演进

看DeepSeek-v3的感受是, 算法和Infra的非常紧密结合. 其实很多大模型团队的算法和Infra是非常割裂的, 完全同时懂算法和Infra的人并不多, DeepSeek这个团队就...

谈谈DeepSeek MoE模型优化和未来演进以及字节Ultra-Sparse Memory相关的工作

大概一个月前发了一篇《一个关于MoE的猜想》,  最近优化DeepSeek MoE推理的时候, 发现这是一个值得去解决的问题, 从算法上, 这是DeepSeek-V3/R1 MoE的一个不...

一向谨慎的微信,这次为何光速拥抱了DeepSeek?

话说,今天,最令人关注的事情就是,微信搜索居然接入了DeepSeek。 简单来说,就是有网友发现,微信正在灰度测试接入DeepSeek R1,在聊天界面顶部进入搜索栏...
1 549 550 551 552 553 596