前沿科技

16个具有“联网搜索”功能的AI:总有一个适合你!

搜索引擎向来是谷歌最重要的现金牛业务,没有之一。自去年生成式AI爆发以来,谷歌在“AI+搜索”上进行的尝试已经不止一次两次了,虽然有些新添加的AI功能因为搜...

数据说话:阿里Qwen 2.5-Max vs DeepSeek-V3,谁更强?

"大家都知道,增加数据量和模型规模可以显著提升模型的智能水平。不过,研究界和工业界在如何有效扩展超大模型方面经验还不多,无论是普通的密集模型还...

Ollama+Nginx+4090打造DeepSeek-R1-32B高可用大模型集群,助力企业拥抱AI时代

今年是 DeepSeek-R1 系列模型深入千行百业,助力企业全面拥抱 AI 变革 的关键一年!无论企业是 自研应用,还是基于大模型推出 ...

科技行业的深度分析:一篇关于 DeepSeek 的深度答疑

Ben Thompson 是科技领域最具洞察力的分析师之一,他的博客 Stratechery 以其对科技行业的深度分析和前瞻性预测而闻名。Q:为什么你还没写关于DeepSeek的文章...

你用的DeepSeek R1是真的还是假的?

“ DeepSeek爆火,国人知识面突飞猛进,一下子从90%的某搜索引擎直接到国际领先水平,一下子大家觉得自己还在用大刀长矛,突然六代机一年2个型号飞起来的感觉...

压测篇 | Ollama+Nginx+4090打造DeepSeek-R1-32B高可用大模型集群,助力企业拥抱AI时代

今年是 DeepSeek-R1 系列模型深入千行百业,助力企业全面拥抱AI变革的关键一年!在企业级场景下,采用模型集群方案至关重要,大模型推理是计算密集...

AI技术创新,DeepSeek之外的应用侧新叙事|甲子光年

2025年的春节假期刚刚过去,但是DeepSeek引发的冲击波仍然余温未散。通过FP8训练、多词元预测、改良MOE架构、多头潜在注意力机制(MLA)、无SFT强化学习等方...

DeepSeek创始人梁文锋的量化前史 | 深网

当DeepSeek以其惊艳的AI大模型技术席卷海内外科技圈时,镁光灯也不由自主地转向了它背后的母公司——幻方量化及其创始人梁文锋。据彭博社报道,根据七位创业公...

8块A100,32B碾压DeepSeek V3、o1-preview!普林斯顿北大首提分层RL推理

仅用8块A100,训出的32B模型,数学性能直接反超o1-preivie?!看来,小模型真的要逆天改命了……近日,来自普林斯顿和北大的华人团队基于一种创新性的「分层LLM...

DeepSeek-V3 高效训练关键技术分析

前言今年春节 DeepSeek-V3&R1 对国内外 AI 圈产生了巨大的影响,其本质在于开拓了一条不同于 OpenAI 训练方法的道路,证明了通过模型架构和训练方法的极...
1 9 10 11 12 13 51