行业上限被拔高!夸克官宣:首个通过主任医师评测的大模型来了
7月23日,夸克健康大模型成功通过中国12门核心学科的主任医师笔试评测,成为国内首个完成这一挑战的大模型。这是继5月通过副主任医师职称考试后,夸克健康大模型的又一次能力跃升。目前,“主任级AI医生”能力已经全面集成在夸克的AI搜索里,查询健康问题的时候,选择深度搜索就可以调用。
之所以是垂类大模型,原因很简单。一方面,垂类大模型相比通用大模型有更强的单一场景专业性,根据夸克公布的数据,在医疗场景下的性能比较,夸克健康大模型的答题正确率,全面超越了通用大模型DeepSeek。这并不是说通用大模型性能不行,只是“术业有专攻”,针对单一场景的垂类大模型,明显会更适合。
另一方面,对于专业领域,AI大模型要面对的是各种各样的问题,这意味着单一的数据库回答并不可靠,尤其是医学领域。举个例子,每一位病人都是感冒,但不同的人会有不同的症状表现,症状的轻重也各有不同,甚至还有一定的并发症和过敏等因素伴随,医生就需要根据病人的症状描述“对症下药”。
因此,垂类大模型不仅要“知识丰富”,更要“会思考”,夸克健康大模型以通义千问为基础,走出了一条面向垂直场景的工程化路线。夸克算法负责人表示:“我们不是在训练AI回答医学问题,而是在训练它学会医学思维。”换句话说,医学垂类大模型不能是AI“闭门造车”,更多的还是和真实医生一同共创。
(图片来自夸克)
而夸克健康大模型的核心突破之一,就是“慢思考”能力。这项能力融合了链式推理和多阶段临床演绎路径建模,驱动模型在面对复杂医疗问题时,能够分阶段、层层深入地推推导出最终回答。
所谓的“医学思维”并非单方面的知识库或者推理能力,夸克健康大模型的思考,是基于高质量训练数据的。为此,夸克构建了“双数据产线+双奖励机制”的工程体系,将医学数据划分为“可验证”和“不可验证”两类,分别对应诊断类任务和健康建议类任务。另外,在训练方法上,夸克引入了“过程奖励模型”和“结果奖励模型”,确保推导过程和最终结果的合理性和准确性。
为了避免AI大模型为了高分而做题而应试行为,夸克健康大模型还设计了多阶段强化学习流程,通过真实医生标注、提问——思考——回答整组数据驱动强化学习,让夸克健康大模型成为了“不读死书”,拥有真正医学思维的AI大模型。
得益于在医学领域的专业性,夸克健康大模型得到了不少专业医师的认可,比如安贞医院心脏外科主任医师谢进生表示,夸克在一些问题上回答的专业度比专业医生更强。同时夸克AI搜索吸引了一大批医学生和医生群体,目前平台在全国医学生中月活用户已突破200万,覆盖率过半,这就是夸克健康大模型在医学领域专业性的证明。
这次夸克健康大模型证明了自己更高的能力上限,但这不是AI大模型的终点。医学大模型除了要在专业领域上不断精进,从应用层面去看,更应该让更多普通用户享受到“人均专业医师”的专业咨询。
发布于:广东
相关推荐
行业上限被拔高!夸克官宣:首个通过主任医师评测的大模型来了
千亿级参数、性能评测霸榜 夸克发布自研大模型
夸克发布自研千亿级参数大模型
发布自研大模型,夸克App将迎来全面升级
对话夸克技术负责人:夸克大模型拿下双榜背后,四大优势、四项能力推进搜索革新
依托数据、平台、知识增强等优势 夸克大模型大幅降低问答幻觉率
大语言模型评测是怎么被玩儿烂的?
中国首个接入大模型的 Linux 操作系统来了
夸克App升级健康搜索 推出健康大模型应用“夸克健康助手”
谁在评价大模型?AI大模型评测榜单乱象调查
网址: 行业上限被拔高!夸克官宣:首个通过主任医师评测的大模型来了 http://www.xishuta.com/newsview139332.html
推荐科技快讯

- 1问界商标转让释放信号:赛力斯 95791
- 2报告:抖音海外版下载量突破1 25732
- 3人类唯一的出路:变成人工智能 25171
- 4人类唯一的出路: 变成人工智 24605
- 5移动办公如何高效?谷歌研究了 24305
- 6华为 nova14深度评测: 13155
- 7滴滴出行被投诉价格操纵,网约 11883
- 82023年起,银行存取款迎来 10774
- 9五一来了,大数据杀熟又想来, 9793
- 10手机中存在一个监听开关,你关 9515