
语言推理:Baichuan-M1-preview在语言推理方面表现出色,其在AIME和Math等数学基准测试,以及LiveCodeBench代码任务上的成绩均超越了其他模型,如o1-preview等。
视觉推理:在视觉推理领域,该模型同样展现出了卓越的能力。在MMMU-val、MathVista等权威评测中,Baichuan-M1-preview的成绩超越了GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview等国内外头部模型。
搜索推理:除了语言和视觉推理外,Baichuan-M1-preview还具备强大的搜索推理能力。这一能力使得模型能够在海量的信息中快速检索到所需内容,并进行有效的整合和分析。
医疗循证模式
Baichuan-M1-preview的另一大亮点是解锁了医疗循证模式。这一模式实现了从医疗证据检索到深度推理的完整端到端服务,能够快速、精准地回答医疗临床、科研问题。为了实现这一能力,百川智能自建了涵盖亿级条目的循证医学知识库,囊括了国内外海量医学论文、权威指南、专家共识、疾病与症状解析、药品说明等专业医疗内容,且以天为单位进行动态更新,及时收录医疗领域的新突破、新进展。
在面对复杂医学问题时,Baichuan-M1-preview会将专业可靠的医疗知识作为推理依据,帮助用户做出最佳的医疗决策。医疗循证模式能运用医学知识和证据评估标准,对证据进行多层分级,并对不同权威等级的证据进行专业分析与整合,精准识别各类权威信息的来源和可信度,从而避免因信息混杂导致的误判。然后基于这些医学证据进行可靠、准确的医学推理,最终提供可信赖的医疗答案。
应用场景
Baichuan-M1-preview的应用场景非常广泛。在深度思考模式下,该模型不仅能准确解答数学、代码、逻辑推理等问题,还能像资深医疗专家一样,通过深度思考构建严谨的医学推理过程,为用户提供全面的疾病分析和个性化健康管理建议。无论是医生面对复杂病案,还是患者寻求权威建议,它都能通过“摆事实、讲道理”的循证方式提供言之有物、有理有据的解答。
为了推动AI技术在医疗领域的创新发展,百川智能还开源了Baichuan-M1-preview的小尺寸版模型Baichuan-M1-14B。这是行业首个开源的医疗增强通用大模型,其医疗能力超越了更大参数量的Qwen2.5-72B,与o1-mini相差无几。Baichuan-M1-14B的开源将为中国AI医疗健康生态建设提供强大助力。
百川智能发布的全场景深度思考模型Baichuan-M1-preview在多个方面都展现出了卓越的能力。这一模型的推出将为AI技术的发展和应用带来新的突破和机遇。