国内首款医疗大语言模型发布，如何赋能数字医疗？

来源：21世纪经济报道
时间：2023-05-31 10:53:02

近日，医联正式发布其自主研发的基于Transformer架构的国内首款医疗大语言模型——MedGPT。与通用型的大语言模型产品不同，MedGPT主要致⼒于在真实医疗场景中发挥实际诊疗价值，实现从疾病预防、诊断、治疗到康复的全流程智能化诊疗能力。

医联MedGPT项目负责人王磊向21世纪经济报道等媒体表示，基于MedGPT，医联引领数字医疗服务正式进入2.0时代，即医联数字医院脱离以互联网医疗连接为根本、以提高效率为主要目的的1.0阶段，进入了基于AI能力实现疾病管理全流程智能化的数字医疗2.0阶段。

【资料图】

近年来，随着医疗数据集的快速扩张、硬件设备的迭代升级、算法模型的优化改进，AI在医疗场景中技术积累越发成熟，应用场景日益丰富，而近期GPT技术的突破再次引燃市场关于AI+医疗/医药的讨论关注。除医联外，谷歌、Hippocratic AI、卫宁健康、联通、创业慧康等国内外行业头部企业在医疗AI领域均有布局，行业应用加速探索。

其中，谷歌于5月11日推出PaLM2语言大模型，其中针对医疗AI领域的Med-PaLM2在USMLE问题测试中的准确率为85.4%，达到医疗专家的水平；生成式AI平台Hippocratic AI能够模拟不同类型的病人与医生进行对话，在114项证书和考试测试中，其中105项均超出GPT-4。在国内企业中，卫宁健康也推出大语言模型WiNGPT，共包含7大类基础任务与20多项子任务，在与ChatGPT问诊对比中，WiNGPT更为专业、准确、简练地生成主诉、现病史、诊断和建议。

赋能数字医疗服务进入2.0阶段

据介绍，通用大语言模型在面对医学问题的准确性上存在天然缺陷，在问诊阶段，通用大语言模型往往会轻易给出结论，但对于医疗应用来说，一致性和准确性是底线问题。针对该问题，医联方面认为，MedGPT能够通过多轮问诊引导患者收集足够的诊断决策因⼦后，再进⼊到诊断环节，从而保证准确性。

王磊向21世纪经济报道等媒体表示，MedGPT不会轻易给出诊断结论，而是会循序渐进地引导患者给出足够能够支撑有效诊断的病情全貌，即MedGPT通过收集足够信息并做出符合医学的决策，以“治愈”为目的而进行人机交互。通过将⾃然语言大模型AI技术、⼀系列⼯程调优技术以及医学⼀致性校验技术相结合，并在模型微调训练阶段采⽤⼤量真实医⽣参与的RLHF(Reinforcement Learning from Human Feedback)监督微调，从而提升模型的疾病特征判断与模式识别能力。

此外，医联还建立基于专家评议的AI诊疗准确性与真实世界医⽣对标测试机制，不断将AI与真实诊疗场景对齐，以实现准确诊断。

医联方面认为，基于Transformer架构，MedGPT 可以整合多种医学检验检测模态能力，首次实现线上问诊到医学检查的⽆缝衔接。在问诊环节结束后，MedGPT会给患者开具必要的医学检查项目以进一步明确病情，患者则可以通过医联云检验等多模态能力进行检查。基于问诊以及医学检查数据，MedGPT可进行准确的疾病诊断，并为患者设计疾病治疗方案。患者可以通过医联互联网医院实现送药到家，MedGPT会在患者收到药品后，主动为患者进行用药指导与管理、智能随访复诊、康复指导等智能化疾病诊疗动作。

除此之外，王磊还认为，医联MedGPT plugin应用平台整合超过1000+医疗多模态能力，完善全流程智能化诊疗体验。“这也意味着医联数字医院脱离以互联网医疗连接为根本，以提高效率为主要目的的1.0阶段，进入了基于AI 能力实现疾病管理全流程智能化的数字医疗2.0阶段。”

作为一项疾病全流程诊疗的医疗专业大语言模型，医联MedGPT也形成其自身的医疗AI建设方法论，分别从Disease（病种覆盖）、Intelligence（智能化）、Accuracy（准确性）、Efficiency（就医效率）四个维度来建设产品，以提升MedGPT的实际医疗应用价值。

目前，医联正不断加速 MedGPT 的研发，医联MedGPT目前的参数规模为100B规模，预训练阶段使⽤超过20亿的医学文本数据，微调训练阶段使⽤800万条的高质量结构化临床诊疗数据，并投⼊超过100名医⽣参与⼈⼯反馈监督微调训练。

王磊介绍，目前医联 MedGPT 已经覆盖 ICD10的60%疾病病种，并在近期将研发重心倾斜在多发疾病，以提升数字医院的普惠率。预计在 2023 年底，可以覆盖80%病种的就诊需求。

多家厂商布局医疗大语言模型

据中泰证券研报分析，人工智能主要指利用计算机通过大量训练学习并模仿人类行为的技术，包括物理发现和识别、自然语言处理、自动推理、语音识别、知识管理等。近年来，随着医疗数据集的快速扩张、硬件设备的迭代升级、算法模型的优化改进，AI在医疗场景中的技术积累越发成熟，应用场景日益丰富。

这实际也是一个积累的过程，如王磊也指出，此前医联已在整体数据积累和技术积累有一定沉淀，但此前却“没有暴露”，因为彼时的产品始终无法实现顺畅的全流程AI诊疗体验，也无法单独推出使用，会受到医生或医助对系统的批评，直到最近Transformer架构大语言模型技术的应用，才使该问题得到解决。“我们对这一领域关注较早，但一直没有敢行动，因为该领域投入太大但不确定性强，而目前进行投入，是因为该技术已得到验证。”

基于当下，中泰证券认为，AI+医疗/医药未来空间广阔，AI在药品开发、病理诊断、医学影像等领域将有广泛应用。

根据Statista的报告预测，全球医疗AI市场规模将从2021年的110.6亿美元增长到2030年的1879.5亿美元，期间复合年增长率为37.0%。同时，根据艾瑞咨询测算结果，2020年中国医疗AI市场规模为29亿元，市场呈现高增长状态，2020年-2025年期间的复合年增长率为43.9%，总规模在2025年将达179亿元，增速领跑全球市场。

在此趋势下，多家头部企业布局医疗大语言模型，多个医疗AI应用相继落地。2023年5月11日，谷歌在GoogleI/O开发者大会上推出PaLM2语言大模型，其中在医疗AI领域推出Med-PaLM2。Med-PaLM2是基于PaLM2的医疗专业大模型，经过医学专业知识的微调，可以进行医疗问答、总结医学文本。Med-PaLM2在USMLE问题测试中的准确率为85.4%，达到医疗专家的水平。

在市场火热下，医疗AI领域医患模拟对话产品也获高额融资。据浙商证券研报介绍，2023年5月17日，生成式AI平台Hippocratic AI宣布获得5000万美元种子轮融资，Hippocratic AI能够模拟不同类型的病人与医生进行对话，为医学生模拟临床环境，在114项证书和考试测试中，其中105项Hippocratic AI表现均超出GPT-4。

从产品角度而言，Hippocratic AI具有4方面性能，首先模拟具有不同疾病、性格、情绪和疾病史的患者和医学生进行对话；其次，医学生可以练习通过模拟检查来形成临床诊断；第三，为医学生的临床技能提供反馈；此外医学生上传自己的医学笔记，根据上传内容将笔记划成不同部分形成问答，便于后续学习。

与此同时，国内头部厂商积极布局，除医联外，联通、卫宁健康、创业慧康等行业头部企业在医疗AI领域均有布局，行业应用加速探索。

同样在5月17日，上海联通携手华山医院、上海超算中心和华为公司等联合发布“Uni-talk”算力网络医疗大模型。在通用模型基础能力之上，融入医学领域专业知识，大幅提升场景感知和理解能力，逐步实现通用人工智能到医疗人工智能领域的融会贯通。“Uni-talk”在通用大规模多语言语料知识库基础上，基于医疗知识图谱收集整理接近亿条医疗专业知识资料进行深度训练学习，保障模型的推理质量、准确性与可靠性。

卫宁健康也推出了大语言模型WiNGPT，据浙商证券研报介绍，卫宁人工智能实验室已完成WiNGPT可行性验证并开始内测，其采用通用GPT架构、60亿参数。2023年5月，WiNGPT训练的数据量已达到9720项药品知识、7200余项疾病知识、2800余项检查检验知识、1100余份指南文档，总训练Token数达37亿。共包含7大类基础任务与20多项子任务，在与ChatGPT问诊对比中，WiNGPT更为专业、准确、简练地生成主诉、现病史、诊断和建议。

未来WiNGPT将以Colipot方式将互联网问诊等功能融合到WiNEX产品中。通过候诊患者预问诊，人工智能快速记录数据并给出回答，医生可以实时看到和引用AI生成的内容，提升回答效率。

创业慧康则推出智能就医助手，拥有就医咨询、导诊、在线问诊、预问诊等功能，已在浙江大学医学院附属妇产科医院成功运行，可针对文字提问提出智能解决方案。当咨询具体疾病问题时，就医助手具有智能自诊和预问诊两项功能。智能自诊功能会根据患者症状描述针对性提问，在询问具体疼痛位置时生成一张人体图，供患者选择位置，最后自动生成智能问诊结果；预问诊功能会根据问答生成患者信息、主诉、现病史，用树状图形式画出患者的主要症状和伴随症状，为医生后续了解病人情况节省时间打下基础。

关于当前医疗AI技术的发展，浙商证券认为，国内医疗IT厂商首先发力和受益的AI产品即为与患者文字互动的智能问诊/就医辅助类产品。当前就医助手类AI产品不需要大量适配院内流程，可以以医疗知识库训练大模型，极大提升问诊类产品的准确性和智能化程度，实现高效导诊、分诊等就医辅助功能，并在医护人员的监督下对患者基础咨询进行自动回复，将极大提升医院运转效率。

关键词：