AI资讯

数据领域难题:大模型的切入点

今年往昔回想起90年代,老爸带回家的第一台电脑,当时我才小学四年级。起初,我们都对这台电脑的用途一知半解,仅仅是沉迷于DOS下的“tt”打字游戏,每天玩得不...

同源异流:腾讯元宝与百度DeepSeek的生态博弈   

引言  2025年开年,DeepSeek成为国内云厂商争相接入的“超级大脑”。百度、腾讯、阿里等巨头纷纷宣布与DeepSeek深度合作,但同源的AI能力为何在产品端呈现出截...

私域大模型建设记录(一)

周日志这周终于在公司内部发起了大模型相关的预研,领导迅速认同了我的想法同时让我去统筹整件事情。其中我写了几个行动方向建议:1. 行动方向:围绕未来构建...

私域大模型建设记录(二)

周日志这两周多的时间里面,我尝试快速科普了大量有关大模型的知识。我们针对想要产出的两款产品定义了基本的分工,包括:大模型评测及选型私有大模型技术预...

AI意识必然性探讨

Lenore Blum和Manuel Blum在最新发表的论文中提出,从理论计算机科学的角度来看,人工智能意识的出现是不可避免的。他们提出了一个名为"有意识图灵机&qu...

一文彻底搞懂大模型 - 人工神经网络与贝叶斯网络

ANN History大模型,特别是那些拥有数十亿甚至更多参数的深度学习模型,往往是以人工神经网络为基础的。这些模型通过堆叠多个隐藏层、增加神经元数量和使用复...

Perplexity :如何设计让用户满意的 AI 原生产品?

Perplexity AI 由一支来自纽约大学和加州大学的团队开发,结合了深度搜索技术和大型语言模型(如 GPT-4),以实现更为精准的搜索结果和信息分析。它的搜索引...

讨论大模型在安全领域的积极与恶意应用

一.  背景大模型(LLM,Large Language Model)本质是拥有巨量参数的语言模型,经过足够的训练后,能够理解和处理人类语言,帮助解决各个领域的问题。安...

从NSA和MoE探寻大模型发展的关键路径

在大模型技术蓬勃发展的当下,训练数据集质量、模型结构优化、推理能力增强成为决定模型性能的核心问题。昨天写了一篇关于NSA(Native Sparse Attention,原...

PolyRouter:AI 调度员为你砍掉30%大模型成本!

哪个大模型最好用?“老板,我们公司现在有一堆大模型,有的擅长聊天,有的擅长写代码,有的擅长分析数据……每次来了新任务,该派哪个模型出马好呢?”这可不是...
1 545 546 547 548 549 596