AI资讯

大模型公司对标:稀宇科技Minimax

公司档案MiniMax自2021年12月成立伊始,便持续专注于推动通用人工智能技术突破,已自主研发不同模态的通用大模型,包括万亿参数的MoE文本大模型、语音大模型...

货拉拉多场景大模型AI助理实践

导读 随着LLM涌现,AI应用范围日益广泛。货拉拉也在积极探索AI落地,以LLM为基础开发出多场景的个人及办公助理,以期在各类应用场景中为用户提供更加智...

“华为”和“知网”生下来的大模型叫“华知”。

课件老师知道有一种叫“华子”的烟,现在有个叫“华知”的大模型网站摆在了面前。2023年以来,人工智能、AI、大模型已经让我们听得想吐了,虽然大家已经收藏了很...

为什么说 OpenAI o1是自Transformer以来最大的更新?

这正是 Ilya 预见到的,这也解释了为什么 Sam 想要海量的计算资源。重新定义缩放定律就像 Transformer 一样,o1 能够有效地用计算资源换取更高的准确性,不同...

KAN2.0:AI+Science的统一新范式

神经网络目前是人工智能中最强大的工具。当它们应用于更大的数据集时,没有什么可与之抗衡。Perimeter Institute for Theoretical Physics 的研究员 Seb...

字节跳动推出两款视频生成大模型

字节跳动在2024年9月24日的火山引擎AI创新巡展上,发布了两款视频生成大模型,标志着其正式进入AI视频生成领域。火山引擎发布豆包视频生成模型火山引擎总裁谭...

从DeepSeek 9篇论文的解读中学点什么(上)

相信年前至今,关于DeepSeek的解读信息大家已经看得足够多了,从最开始的震惊海外、用户激增,一直到国运之争。虽然其中也不乏深度的分析和多元的视角,但归...

代号002:谷歌发布两款Gemini 1.5升级生产级模型「一流数学能力,价格砍半」

刚刚谷歌的 Gemini 模型又双叒叕升级了!谷歌发布了两款更新后的可投入生产的Gemini模型:Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002,以及以下...

基础篇| 大模型部署框架

为什么要有大模型部署框架?为什么有了推理框架,还要来一个什么部署框架?上节内容我们介绍了有12种大模型推理框架,虽然多,但是现在业界尚不存在各方面都远...

英伟达×DeepSeek-R1-FP4:AI算力革命的"核弹级"突破与技术深析

在AI技术狂飙突进的2025年,英伟达与DeepSeek强强联手,推出了颠覆行业的DeepSeek-R1-FP4模型。这款基于Blackwell架构的优化方案,不仅以25倍的推理速度刷新...
1 409 410 411 412 413 489