对话超参数:Agent 诞生于游戏,最终会走进生活
复杂性科学的奠基人布莱恩·阿瑟总结:「新技术诞生于已有的技术组合。」超参数科技成立于 2019 年初。时间上,是如今被称为上一代 AI——即「模式识别」,浪潮...
MiniCPM3-4B:端侧部署的新选择,性能媲美 GPT-3.5 Turbo
在大模型领域,参数量和性能似乎总是正相关:参数量越大,能力越强。然而,这并不是绝对的。最近推出的 MiniCPM3-4B 用 4B(40亿)参数量,在多个场景...
金融大模型发展现状、趋势与建议(上篇)
自2022年ChatGPT发布以来,AIGC技术得到各行业广泛关注,并逐渐发展为集图像识别、语义理解、视觉感知于一体的多模态、全应用大模型体系。金融机构基于丰富的...
OpenAI 新货详解:Canvas 更新,可运行 Python
今日发布Canvas一个画板给 ChatGPT 输出内容还能运行代码可以在常规聊天和 GPTs 中使用和 Claude 不同在 Claude 中生成的内容也会被显示在一侧比如这样...
腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践
导读 在本篇文章中,我们将深入探讨腾讯大语言模型在多个业务场景中的应用,特别是如何通过前沿技术提升模型的智能化与用户体验。首先介绍腾讯大模型的...
Mooncake牛批!提升Kimi吞吐量525%
LLM调度的核心KVCacheMooncake作为Moonshot AI提供的Kimi服务的后端平台,提出了一种以键值缓存(KVCache)为中心的解耦架构,旨在优化长上下文场景下的服务...
o1已经很猛了,200刀的o1 Pro版还能更强?13个案例直接看懵!
短短3天时间,OpenAI的o1和o1 Pro版已经在AI圈炸开了锅。有人感谢:“200刀/月是真的贵,但试过 o1 Pro 后,只会觉得‘花得太值了!”今天就带你一口气盘点下面 ...
大模型“翻车”背后的技术原理及解决方案
本文将从两个常见的大模型翻车问题入手解析这些问题背后体现的大模型技术原理(Tokenization与预测下一个Token),并解释了为什么会导致这些问题,接着我们利...
字节跳动:AI 落地,实力派玩家入局
AI潮涌,字节跳动未能抢得先机,起步就已经是加速模式。从C端市场建立以豆包为代表的生成式AI应用矩阵,试图复制移动互联网时代的辉煌,到在B端市场打响模型...
从大数据到大模型:如何做到“心无桎梏,身无藩篱”?
背景韦伯总结了现代社会的四个本质特征,其中很重要的一点,现代社会是一个祛魅社会,其本质就是科学性。科学性在于可证伪性,不可证伪的不能称为科学理论,...