前沿科技
金融领域NER大模型性能及视觉文档理解技术总结
今天是2025年01月11日,星期六,北京,天气晴。我们来看两个事,一个是视觉文档问答模型的技术总结,是文档多模态领域的一个总结,有几个关键议题。另一个是...
星际之门:5000亿的星辰大海,还是马斯克口中的镜花水月?
项目背景和目标Stargate项目是由OpenAI、软银、甲骨文以及主权基金MGX共同成立的合资公司,旨在建设人工智能基础设施。项目的雏形早在24年的三月就由微软和Op...
深入理解:BERT模型
BERT,英文名字来自:Bidirectional Encoder Representations from Transformers 简写,翻译过来就是:基于 Transformer 的双向编码器表示法。BERT...
2025 年:如何构建有效的智能体
本篇文章来自Anthropic,我用大模型给翻译了一下,以下是全文。过去一年里,我们与数十个团队合作,跨行业构建大型语言模型(LLM)智能体。通常,最成功的实...
刚刚,OpenAI发布o1模型新突破,推理时间增强对抗鲁棒性
专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注...
GPT-5 可能会颠覆一切!
传说中的GPT5可能会颠覆一切。这条消息,最早是由Alberto Romano在一篇长篇大论的文章中详细阐述,深入探讨了GPT5目前的状态。一些人工智能实验室,可能正在...
漫画大模型简史
时间的从1943年说起,沃伦·麦卡洛克(Warren McCulloch)和沃尔特·皮茨(Walter Pitts)提出了人工神经元模型,也就是阙值逻辑单元(TLU),这是神经网络研究...
1M长上下文,满血版Gemini 2.0又一次登上Chatbot Arena榜首
就在国内各家大模型厂商趁年底疯狂卷的时候,太平洋的另一端也没闲着。就在今天,谷歌发布了 Gemini 2.0 Flash Thinking 推理模型的加强版,并再次登顶 Chatb...
在可以 RL 的地方,将迎来更多「李世石时刻」
在 AI 领域,强化学习(RL)作为 LLM 的关键训练方法,已成为行业共识。其灵感来自于 AlphaGo、AlphaStar、OpenAI Dota Five 等掌握了围棋、星际争霸II 和 Do...
2025 AI 展望:Scaling Law新叙事加速 AI 变革
我们正身处一场技术革命的历史开端,以 ChatGPT 为标志的这轮 AI 科技浪潮是算法和软件诞生以来人类科技最重要的技术变革,由此开启了以智能为核心的第四次工...