首页科技快讯行业上限被拔高！夸克官宣：首个通过主任医师评测的大模型来了

行业上限被拔高！夸克官宣：首个通过主任医师评测的大模型来了

来源：晰数塔互联网快讯时间：2025年07月24日 16:27

7月23日，夸克健康大模型成功通过中国12门核心学科的主任医师笔试评测，成为国内首个完成这一挑战的大模型。这是继5月通过副主任医师职称考试后，夸克健康大模型的又一次能力跃升。目前，“主任级AI医生”能力已经全面集成在夸克的AI搜索里，查询健康问题的时候，选择深度搜索就可以调用。

之所以是垂类大模型，原因很简单。一方面，垂类大模型相比通用大模型有更强的单一场景专业性，根据夸克公布的数据，在医疗场景下的性能比较，夸克健康大模型的答题正确率，全面超越了通用大模型DeepSeek。这并不是说通用大模型性能不行，只是“术业有专攻”，针对单一场景的垂类大模型，明显会更适合。

另一方面，对于专业领域，AI大模型要面对的是各种各样的问题，这意味着单一的数据库回答并不可靠，尤其是医学领域。举个例子，每一位病人都是感冒，但不同的人会有不同的症状表现，症状的轻重也各有不同，甚至还有一定的并发症和过敏等因素伴随，医生就需要根据病人的症状描述“对症下药”。

因此，垂类大模型不仅要“知识丰富”，更要“会思考”，夸克健康大模型以通义千问为基础，走出了一条面向垂直场景的工程化路线。夸克算法负责人表示：“我们不是在训练AI回答医学问题，而是在训练它学会医学思维。”换句话说，医学垂类大模型不能是AI“闭门造车”，更多的还是和真实医生一同共创。

（图片来自夸克）

而夸克健康大模型的核心突破之一，就是“慢思考”能力。这项能力融合了链式推理和多阶段临床演绎路径建模，驱动模型在面对复杂医疗问题时，能够分阶段、层层深入地推推导出最终回答。

所谓的“医学思维”并非单方面的知识库或者推理能力，夸克健康大模型的思考，是基于高质量训练数据的。为此，夸克构建了“双数据产线+双奖励机制”的工程体系，将医学数据划分为“可验证”和“不可验证”两类，分别对应诊断类任务和健康建议类任务。另外，在训练方法上，夸克引入了“过程奖励模型”和“结果奖励模型”，确保推导过程和最终结果的合理性和准确性。

为了避免AI大模型为了高分而做题而应试行为，夸克健康大模型还设计了多阶段强化学习流程，通过真实医生标注、提问——思考——回答整组数据驱动强化学习，让夸克健康大模型成为了“不读死书”，拥有真正医学思维的AI大模型。

得益于在医学领域的专业性，夸克健康大模型得到了不少专业医师的认可，比如安贞医院心脏外科主任医师谢进生表示，夸克在一些问题上回答的专业度比专业医生更强。同时夸克AI搜索吸引了一大批医学生和医生群体，目前平台在全国医学生中月活用户已突破200万，覆盖率过半，这就是夸克健康大模型在医学领域专业性的证明。

这次夸克健康大模型证明了自己更高的能力上限，但这不是AI大模型的终点。医学大模型除了要在专业领域上不断精进，从应用层面去看，更应该让更多普通用户享受到“人均专业医师”的专业咨询。

发布于：广东