北大团队发现DeepSeek致命漏洞,黑客一句话就能搞瘫你的AI服务

  近日,北京大学YuanGroup团队披露了国内知名大模型DeepSeek的 致命漏洞--仅需输入特定指令 ,就能让DeepSeek-R1陷入无限思考状态无法终止。研究人员警告称...

居然可以这样理解【Transformer】,中学生都能看懂!

Transformer 是大语言模型中的一种重要运行机制,它为大语言模型(LLM)提供了一种高效、灵活且强大的方法来处理和理解复杂的语言信息,它使得大模型能够更好...

LongWriter:现在 LLM 可以生成 20,000 字的输出

在本文中,我们将探讨 LongWriter,它能够生成更长的序列。它可以生成高质量且连贯的 20,000 字。LLMs的问题是什么?为什么现有的LLMs无法生成超过2K字...

秒懂Function Call:DeepSeek大模型的隐藏超能力,让AI从"会聊天"变"会做事"

大家好,我是九歌AI。 想象一下,你走进一家高档餐厅。你不需要自己跑到厨房做菜,只需告诉服务员:'我想要一份香煎三文鱼,七分熟,配芦笋和柠檬汁。' 服务...

树莓派也能玩转DeepSeek!全网首发,教你轻松接入大模型,不限流,速度超快!

嘿,各位技术爱好者和开发者们!今天我给大家带来了一个超实用的教程——如何接入DeepSeek R1,并且还会介绍最近的超值优惠活动。不仅如此,我们还会展示如何在...

OpenAI发布高级语音模式(AVM):ChatGPT更自然的对话体验

01。概述 OpenAI于周二宣布,将向ChatGPT Plus和团队级别的付费用户推出高级语音模式(AVM)。这项音频功能将使用户与ChatGPT的对话更加自然。AVM的初期...

让外行秒变 AI 大模型专家的十个时髦技术词汇

一、AI Agent(智能体)——你的赛博瑞士军刀 如果把大模型比作「大脑」,那 AI Agent 就像个装满工具的万能背包:订外卖、查天气、写周报…每个技能都对应一...

OpenAI全新发布o1模型 - 幕后采访及一些原汁原味的解释

3分钟的幕后人员采访,值得看一遍,我加了中英翻译的字幕印象深刻的点:o1是一个推理模型,所以在回答问题之前会推理的更多。所以什么是推理?有些简单的问题...

微软:探索AI Agent框架

AI Agent框架是为简化AI Agent的创建、部署和管理而设计的软件平台。这些框架为开发人员提供了预构建的组件、抽象和工具,以简化复杂AI系统的开发。 这些框架...

大模型 “四小龙” 背后的 “清华系” 究竟有多牛?

9月25日出差北京,来百川智能交流业务,不得不感叹成立一年估值就达到了200亿的企业,却这么低调务实~!百川智能作为2023年4月成立的第一批国内AI大模型公司...
1 401 402 403 404 405 483