◎本报记者 张佳星
近日,京东健康旗下“京医千询”医疗大模型宣布开源,成为国内医疗行业首个全面开源的垂类大模型。
当前,大语言模型在诸多应用中展现出巨大潜力,但在医疗决策支持方面,仍面临缺乏专家级认知等问题。如何让人工智能(AI)习得更专业的医学思维方式?如何使医疗AI在辅助诊疗时灵活运用人类在医学领域的经验?“京医千询”团队研发出一种新方法,能有效捕捉临床医生的决策路径,将其数据化,进而为模型训练提供大量医学专家推理的模拟数据。这一新方法近日发表于arXiv预印本网站。
“病人不会按照教科书和指南得病。”京东健康探索研究院高级研究员刘慧说,临床医学是基于循证知识和实践经验的综合科学,除了指南、教科书上的“显性”知识,医生还需要不断实践思考,做出个性化的诊疗决策,积累“隐性”经验和能力。
“AI的训练过程与人才培养的过程相似。”论文第一作者、京东健康探索研究院首席科学家王国鑫告诉科技日报记者,在临床实践中,医生不断累积接诊经验,在思维方式上产生质变,“悟”出心得,这在本质上就是数据训练。因此,高水平的医疗数据是AI训练的基石。
团队基于京东互联网的场景沉淀,并与线下医院合作,为大模型训练汇集基础数据。然而,将经验数据化非常困难。一方面,医疗决策往往具有模糊性、不确定性等特点,模型难以有效反映专家判断方式的复杂性;另一方面,获取真实世界的专家级临床推理数据面临挑战,因为它需要捕捉专家思维的细微差别,而这些细微差别往往难以量化。
鉴于临床数据难以复制临床实践的动态性和模糊性,团队研发出一种用来模拟医学专业人员认知推理过程的方法。这种方法为多阶段训练方法,结合了连续预训练、监督微调和强化学习等多个阶段,专门针对临床场景定制,显著提升了跨多个模型的复杂推理能力。
“新方法再现了临床决策的动态和迭代特性。”王国鑫介绍,团队在大量模拟医学推理数据集上训练“京医千询”,使其推理能力更贴近于临床实践。团队成功将新方法转化为一种可训练的方法,在各种医疗基准测试中显著提高了几个开源基础模型的性能。
团队还将模型及其训练数据作为开源资源公开,进一步降低了医疗AI应用的开发门槛,让更多医疗机构、开发者可以基于“京医千询”快速开发出适合自身需求的医疗AI应用。同期开源的还包括一个基于真实世界数据的大规模、可更新的临床实践评估数据集。
“我们希望开源能推动AI模型不断取得新突破。”王国鑫说,目前看来,AI模型的能力上限仍在不断提升。除了要能在“大数据”中抽提价值,AI还需要从“小数据”中获得学习能力。随着AI助手的普遍应用,AI医生能与人类医生一起成长,积累更多“悟”的经验,推进AI驱动的医疗决策研究。
业内也在不断发展相关技术能力,例如,通过思维链生成技术增强医学模型的推理能力。业内专家认为,推理过程模拟是模拟人的逻辑思考能力,不仅可以应用于医疗领域,也可以用于文章创作、科学研究等领域。这种新方法有望在创造性活动中提升AI的能力。
0 条