庆祝商汤医疗完成过亿元Pre-A轮融资。
作为国内AI龙头商汤科技的副总裁、研究院副院长、商汤医疗CEO,张少霆在2018年加入商汤时,就是以“智慧健康负责人”的身份亮相的。
去年夏天,国内首个AI病理大模型PathOrchestra就出自商汤科技、西京医院及清华大学的合作团队,号称“实现了全球最广泛的临床科研任务赋能,完成了人工智能病理研究领域从‘单模专病’到‘一模多病’的跨越式突破”。近日,国内通信技术龙头华为参与发布“瑞智病理大模型RuiPath”,让病理大模型再次受到公众关注。
作为AI医疗大模型领域最具挑战性的“明珠”,病理大模型为何让龙头频频驻足?近日,
商汤科技副总裁、研究院副院长、商汤医疗CEO张少霆
都知道DeepSeek,但什么是病理大模型?
与DeepSeek等通用大模型不同,病理大模型专注于解决病理科医生面临的临床问题;但与宫颈癌筛查等专用模型也不同,病理大模型致力于解决多种临床任务。资料显示,PathOrchestra覆盖肺、乳腺、肝脏、食管等20余种器官,赋能百余项临床任务,是当时全球赋能临床任务最广的病理大模型。
AI病理诊断流程 所以,病理大模型并不是大家常说的“大模型”,它更接近传统的预训练模型,还不能像语言大模型一样“大[*]四方”,还需要往下游任务深化。
病理大模型的优势在于,它可以在长尾问题上减少对传统数据收集和标注的需求,从而提高模型的训练效率,更好地适配并解决子问题。
回过头看,我们对病理领域的大模型研究是伴随着技术范式的变化自然而然地发生的,经历了三个阶段。2018年起,专注于胃肠和宫颈TCT的单点应用;2021年起,与瑞金医院合作将下游任务拓展到9种不同的疾病,在迁移学习方面取得了一定的成果;2023年起,开始尝试训练病理大模型,来覆盖多达几十种“长尾”疾病。
当下也还有很多病理切片需要医生亲自查看,例如肿瘤组织标本,需要根据病理切片进行十几种不同疾病亚型的分类和判别。目前,将这类任务完全交给病理大模型还为时尚早,因为大模型目前只具备通用的“排兵布阵式”的阵法知识,缺少逐个击破的作战能力,如果每个亚型都存在一定出错概率,十几种亚型都同时正确的概率就低很多。
病理大模型不容易做,但能有效解决两大问题
2023年是大模型技术突破之年,当年发布医疗大模型产品的医疗企业多达数十家,资本市场曾掀起一股AI医疗热潮。但由于应用落地存在挑战,这些医疗大模型在2024年的声量明显下降。如今,当以病理大模型为代表的专科大模型登场,它们面临的挑战似乎只多不少。
PathOrchestra是基于当时国内规模最大的数字病理图像数据集训练建立的,但仅仅数据量大是不够的。如果我们回顾一下来自哈佛、微软和斯坦福的那几篇发表在杂志上的,就会发现数据的分布更为重要。例如,胃肠和宫颈TCT这两个领域的数据量是巨大的,但是其中有多少是关于乳腺、肝脏等其他细分领域的数据?所以病理数字化程度越高、越广泛,数据有足够的覆盖面,大模型才能均衡处理足够多元的任务,而这是不容易平衡的。
而大模型能够有效解决这两个问题。在长尾问题上,大模型至少能提供比“没有解决方案”更好的选择;在泛化性上,大模型可以作为一个编码器,提取病理图像特征后再针对某个疾病的专项诊断模型进行优化,这种机制让大模型能够更好地总结病理数据的特征,从而具备更广泛的疾病覆盖能力。
不过,需要再次强调的是,病理大模型目前还无法像语言大模型那样全面且直接地解决很多问题,更多是集中在科研领域。
医院院长们怎么看待AI潮?
医院是病理大模型等专科模型的直接买方。在张少霆看来,公司去年参与的湖北省“‘小切片’守护大民生”工程,是病理AI模型落地的标志性事件。这场发生在湖北全省医院的智慧化、数字化和AI化转型,覆盖了数百家基层医院。这一事件也预示着,病理大模型落地应用似乎已经达到了突破的临界点。
然而,医院决策采购的核心考量之一是能否带来增量收入。有时候说服决策层支持采购的难点在于,大多数AI医疗产品的卖点是帮助医生更准确地诊断和节省时间,而不是直接为医院带来新增收入或快速回本,这也是之前AI医疗产品的推广面临困难的原因之一。
但从另一个角度看,通用大模型的医疗价值可能确实被夸大了。这些大模型的通用性能很强,在很多任务上实现了超出预期的效果,但幻觉问题也不可忽视。从某种角度来看,幻觉问题在通用领域或许并非坏事,因为模型可以像人一样“编故事”,但在严肃领域,尤其是医疗领域,这可能是致命问题。
实际上,目前我们在上海瑞金医院病理科应用于临床、帮助医生完成大量任务的还是商汤的专有模型,且效果已经经过了多年临床验证。
病理大模型的产业化还有多远?
2023年,多个病理大模型的海外研究项目发表在及上,这表明,这一领域在学术界已经非常活跃,工业界也在进行一些尝试。但需要浇一盆冷水的是,目前病理大模型的价值更多体现在学术界,而非产业界。
但是,病理大模型往往号称能诊断几十种疾病,这种复杂性很难在认证中被全面评估,很难通过NMPA或FDA的严格认证过程,所以产业化目前还是以病理专才模型为主。
另外,市场教育和生态链合作也是商业化的重要环节。目前,病理AI的普及程度还相对落后。病理科工作流相对复杂,其落地涉及到扫描仪厂家、AI厂家、存储厂家等产业生态的联动,更需要生态合作伙伴的精诚合作。例如在瑞金医院,商汤主要负责AI研发,衡道病理负责部分信息化,华为主要提供存储硬件,通力合作打造了瑞金智慧病理样板。
当然了,从技术到商业,我们常常高估一年的变化,却低估十年的变化,所以大家可以给这个行业多一些耐心。