AI资讯

【LLM】一文详解MHA、GQA、MQA原理

前言本文回顾一下MHA、GQA、MQA,详细解读下MHA、GQA、MQA这三种常见注意力机制的原理。self-attention在自注意力机制中,输入通常是一个统一的输入矩阵,而这...

学习大模型开发,需要具备人工智能或深度学习理论基础吗?

“ 学以致用,问题才是学习的真正驱动力 ”最近发表了几篇关于学习人工智能技术的文章,然后就有人问没有深度学习的基础可以学习人工智能吗?答案是...

Manus的闭门会,讲了关于AI产品的5个判断

继DeepSeek出圈后,又一款中国AI产品火了! 昨天凌晨,Monica.im发布了全球首款通用Agent产品——Manus。 如果说,DeepSeek完成了中国公司在大模型领域的逆袭...

腾讯广告基于混元大模型的生成式召回落地实践

摘要大语言模型(Large Language Model,LLM)经过近些年发展,已展现出强大的对人类语言表达的信息输入的理解、联想和逻辑推理能力,并具备世界知识中的语言...

这也太强了吧!OpenAI Realtime API 的这些用法让人拍案叫绝!

自从 OpenAI 发布 Realtime API 后,开发者们的创造力迅速爆发。短短一周时间,各种创新的应用层出不穷,充分体现其实时处理语音与文本的卓越能力。很多用法...

大模型智商已达120

引言人工智能专家John J. Hopfield和Geoffrey E. Hinton获得了2024年诺贝尔物理学奖,表彰他们通过人工神经网络实现机器学习的基础性发现和发明。这个事件引...

【详细拆解】首款通用Agent产品Manus工作流

昨晚全球首个通用Agent Manus预览版正式发布,其官方展示的效果令人惊叹,展现了强大的任务规划与执行能力。目前还没拿到邀请码,以下是通过对官方网站案例的...

AI翻译界杀手诞生!阿里国际翻译大模型吊打谷歌和GPT-4

【新智元导读】AI翻译,全球大厂都卷疯了!但「绿就是白」「光腿神」这类翻译却让人啼笑皆非。就在刚刚,阿里国际发布首个商用翻译大模型,电商出海神器真来...

Yann LeCun最新万字演讲:致力于下一代AI系统,我们基本上不做LLM了

Yann LeCun最新哈德逊论坛演讲:了解我们在通往人类水平AI的旅程中所处的位置,Yann基本上对现在LLM发展方向持否定态度Yann LeCun说,扎克伯格(Mark Zuckerb...

百度为什么没有做出DeepSeek

百度为什么没有做出DeepSeek,过去百度投资或者做过不少产品,但结果不太理想,比如极越汽车事件,外界会觉得这本身就不是百度擅长的事,失败了也正常。但百...
1 501 502 503 504 505 596