前沿科技

沈向洋院士在2024年外滩大会上的演讲全文

编者按:这篇文章是香港科技大学校董会主席、美国国家工程院外籍院士沈向洋(Harry Shum)在2024年9月5日开幕的2024年外滩大会上的演讲实录。在题为《大模型时...

DeepSeek背后的技术基石:MoE、数据并行与模型并行全解析

在过去的几年里,深度学习技术已经实现了飞速的发展,尤其是在大规模模型方面。从GPT-4到DeepSeek再到各种翻译、语音识别等大型应用场景的背后,都离不开大模...

大模型的科普及信创领域研发和场景应用

一、大模型的细分赛道大模型的细分赛道主要根据其所处理的数据类型和任务来划分:语言大模型:主要处理文本数据,如 GPT、字节Coze大模型、阿里通义千问大模...

一个 DeepSeek 倒了,千千万万个 DeepSeek 又站起来了?!

  最近,很多小伙伴都反映 DeepSeek 经常出现服务器繁忙的情况,这确实让人挺头疼的。别担心,今天就给大家介绍几个超实用的平替方案,让你不再为 DeepSeek ...

Agent(智能体)和 MetaGPT,一句话实现整个需求应用代码

我们可以看出,儿童绘本故事的整个流程如下:在整个流程中,其实我们核心就做了 2 件事:设定主题明确需求、编排整个流程让应用跑起来。而其他的包括构思文案...

DeepSeek 背后的数学:GRPO

  GRPO 的数学原理其实就像一套高效的评分系统,它帮助 DeepSeek 模型在一组回答中迅速找到最佳答案。通过比较每个回答与其他回答的优劣,模型能清楚地知道哪...

Agent评估探讨

自从OpenAI发布ChatGPT之后,一场围绕大语言模型(Large Language Model, LLM)的研究热潮席卷全球,这些研究不仅包括大模型本身的训练、推理、微调、评估,...

万字长文全面解读YOLO的前世今生:从 YOLO-v1 到 YOLO-v12

小荷才露尖尖角,早有蜻蜓立上头。大家好,我是微信公众号《小窗幽记机器学习》的小编「卖热干面的小女孩」——因项目需要深入目标检测领域,今日为大家全景解...

技术解读:Agent Q自主AI代理的高级推理与学习

技术解读:Agent Q自主AI代理的高级推理与学习1. 引言1.1 研究背景与动机近年来,大型语言模型(LLMs)如GPT-4、ChatGPT以及最新的LLaMA-3等,在自然语言处理...

Agentic AI:改变商业和技术的下一个重大突破

人工智能世界正在飞速发展,就在你以为自己已经理解了生成式人工智能时,另一个改变游戏规则的概念出现了:代理式人工智能。这项创新技术不仅仅是另一个行业...
1 540 541 542 543 544 596