AI资讯

DeepSeek R1 给我的冲击

刚刚看完 Sam Altman 和印度科技部长 Ashwini Vaishnaw 的直播视频,然后特兴奋。加之春节期间 DeepSeek 引发的蝴蝶效应,我此刻尤其期待 2025 年 AI 的变化...

大模型涉及到的精度有多少种?FP32、TF32、FP16、BF16、FP8、FP4、NF4、INT8都有什么关联,一文讲清楚

大模型的训练和推理,经常涉及到精度的概念,种类很多,而且同等精度级别下,还分不同格式,网上没看到一篇能够介绍全面的,这里梳理总结一份全面的介绍。整...

“AI三杰”都是广东人,为何都没在广东发展?

最近在网上看多一个说法:中国“AI三杰”都是广东人,但都没有在广东创业和发展。‍‍‍‍网友口中的“AI三杰”指的是Deepseek的创始人梁文锋、kimi创始人‍‍‍杨植麟、...

Google Gemini 2.0 Pro来袭,DeepSeek突然觉得不香了?

Google的重磅更新让AI圈又沸腾了!Gemini 2.0 Pro Experimental正式发布,这是Google迄今为止最强大的Gemini模型。与此同时,谷歌还带来了两款新成员:Gemini...

Gemini 2.0 Flash小试牛刀

         Gemini 2.0 Flash 是谷歌最新推出的大型语言模型(LLM),它将人工智能的能力推向了新的边界。本文将深入探讨其关键特性...

DeepSeek 对国内互联网巨头的影响

DeepSeek 的成功打破了之前国内科技领域对于大语言模型的既定发展范式,或许接下来会产生一些涟漪效应。‍‍‍‍‍‍‍‍‍‍无可否认 DeepSeek 已经取得了成功。从当前...

大模型数据建设探索与实践

导读 本次分享题目为大模型数据建设探索与实践。主要介绍:1. 从工程化视角看数据建设2. 预训练数据配比3. 后训练数据筛选4. 问答...

国产 AI 搜索接入 DeepSeek,高速,满血,还能联网!

在那个年味虽然不浓但班味十足的除夕,我们依然“天涯共此时”。一边研究着 DeepSeek 的技术论文,学习着各路大神的分析,一边分享测试时好玩的 Case 或 bug,...

AI自创符号语言:DeepSeek内部私语被曝光!

一个关于AI研究人员发现DeepSeek R1和V0之间对话的记录。文件中包含了一些抽象的符号和诗意的语言,可能是在描述某种新的交流形式或认知过程。作者说:整个R1...

OpenAI发布了ChatGPT新功能Deep Research(深度研究),几分钟内完成人类需要数小时才能完成的工作

ChatGPT 的深度研究(Deep Research),这是一种新的代理能力,能够在互联网上对复杂任务进行多步骤研究。它能在几分钟内完成人类需要数小时才能完成的工作。...
1 185 186 187 188 189 223