医疗大模型陷入 “三重门”：数据饥渴、思维断链与商业闭环之困

原创杨光 2025年07月3日转自：

新视界、新思维、新洞察

从检查病历的“电子哨兵”到眼科OCT图像的“AI读片专家”，AI正从病历质控的“质检大师”逐步进化为诊疗全流程的“智能协作者”，从门诊智能问诊、电子病历生成到临床决策、支持手术精准导航，其应用逐渐渗透到医疗核心环节，这标志着AI技术从医疗外围辅助向核心业务领域的纵深突破。AI+医疗，看上去很美，听上去热血沸腾，但深度应用并不容易。

当清晨的第一缕阳光照进诊室，AI系统已完成了电子病历的智能质控；当皮肤科医生凝视显微镜时，深度学习模型正以95%的准确率标记着恶性黑色素瘤的边界；当心内科专家面对复杂的心肌病病例，临床决策支持系统瞬间调阅了近五年相似病例的诊疗方案——这就是正在发生的医疗革命。医疗AI的万亿蓝海下暗礁丛生——数据孤岛、思维链复现、伦理合规、商业闭环……都是医疗大模型广泛应用需闯过的生死关。这场技术与应用突围的成败，将决定AI是重塑医疗行业，还是沦为科技泡沫。医生写完病例，AI负责检查，关键字段完整性，基础信息是否准确，以批注形式反馈，医生确认后自动生成标准病历。这种“人机双审”模式能够显著降低文书错误率。“北京大学第一医院使用AI质控系统提高病历质量，未来我们希望通过语音识别技术实现病史采集的自动化与标准化，解决病历书写效率问题。”北京大学第一医院副院长李航表示，“AI在医疗领域的应用应遵循从效率工具到决策支持的技术演进路径。医疗大模型的应用不仅仅是辅助疾病诊断，而是进一步提供鉴别诊断可能性排序及诊断逻辑可视化，这样既能辅助临床决策又可以促进医生培养，这也应该是未来发展的方向。”在中日友好医院与北电数智联合攻关的AI+医疗项目中，针对皮肤疾病的“樱智·α专病大模型”开始辅助诊断生涯。通过可信数据空间及服务，在数据不出院的前提下便可完成模型训练，解决早期医疗大模型面临的能力不足、数据合规两大问题。北电数智CMO杨震介绍，该模型“吸收”了临床医生大量非标准化诊疗经验，在权威专家团队审核后建立知识库，同时联合建立评测体系量化模型，通过“权威知识库+量化评测标准”组合，解决模型训练的数据质量问题，确保AI输出符合临床可用性阈值。心肌病亚型超20种，传统诊断依赖医生经验，误诊率较高。中关村熙睿心脑肿瘤精准医疗研究院信息总监段岩峰与其团队联合中国医学科学院阜外医院心肌病病区耗时5年，研发心肌病诊疗大模型。该模型融合大模型技术、智能体技术、多模态医学数据理解等多项技术，具备对心电图、心脏超声、磁共振、CT影像、病理数据、基因信息及病历资料的多源融合分析能力，能够协助医生实现心肌病的早期识别、分型诊断、风险评估和个体化治疗方案推荐，大大提升诊疗效率与准确性，可应用于心肌病相关诊疗和健康管理等多个场景。基于病灶识别技术，图湃医疗联合语言大模型，实现了OCT（光学相干断层扫描技术）问诊，把设备变成医生。“通过手术显微镜的术中OCT系统，开创性地把诊断推进到术中阶段。目前，我们是唯一具备实现术中精准AI辅助导航软硬件条件的企业。这一技术可以将复杂手术简单化，帮助基层医院开展复杂的四级手术。”图湃医疗联合创始人兼首席执行官王颖奇说。中山大学中山眼科中心的ChatZOC、爱尔眼科集团的AierGPT大模型已经在系统内医院广泛使用；温州医科大学眼视光医院的通用大型生成式医学影像模型（MINIM）、北医三院的角膜病识别诊断和同仁医院的眼底图像大模型等也已经完成了阶段性的开发和部署。

近年来，国家高度重视人工智能产业发展，先后出台《新一代人工智能发展规划》《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》等政策文件。工信部积极落实“AI+战略部署，在医疗领域取得显著成效。根据《医药工业数智化转型实施方案（2025—2030年）》，工信部联合多部门推动AI与医疗深度融合，通过“揭榜挂帅”机制已培育104项智能医疗器械创新成果。同时，国家卫健委公布的84个AI医疗应用场景中，医学影像辅助诊断等应用已在全国3000余家医疗机构落地，充分体现了AI+医疗应用的快速发展态势。“每天有5000万人在搜索引擎搜健康相关问题，14亿人都有医疗和健康管理的需求，医疗大模型市场需求巨大。”杨震表示。医疗大模型产业发展面临哪些难点？医疗大模型广泛应用存在哪些堵点？

数据饥渴症医疗大模型的贫血困境

数据犹如血液。“通用大模型技术已经比较成熟，阻碍医疗大模型产业发展的主要问题之一是高质量数据的缺乏和获取难。”段岩峰认为。完整、准确、标准化、原始形态数据的获取与治理是医疗大模型（尤其心肌病这类复杂、亚型众多的疾病）研发的关键。以心肌病大模型为例，段岩峰表示，需要获取以下几个维度的数据。第一，临床基线数据。包括血常规、生化检查等近20类检验数据，以及心电图、超声心动图等六七类检查数据。第二，医生详细的诊疗过程和诊断结果。第三，随访数据。患者出院或手术后的生存状态、并发症、功能恢复等长期随访结果。第四，检查设备原始数据。例如，心电智能模型研发需要心电仪器的原始数值信号，而非仅心电图报告；心超智能模型研发需要原始动态影像视频，而非仅图文报告（报告信息损失大）。第五，遗传数据。心肌病遗传概率高，因此需要获取基因检测结果数据。第六，阴性/对照数据，健康人群或非此病患者大量高质量数据，用于模型训练和验证。此外，部分亚型疾病需要心肌活检病理分析数据。检查设备原始数据就像被锁在重重堡垒中的宝藏，这些高价值信息被困在三个维度的“数据孤岛”中。第一，机构间的“诸侯割据”。医院间数据互认尚未普及。设备厂商的封闭系统形成技术壁垒，各自的数据存储格式不同。第二，部门内的“蜂窝式隔离”。同一家医院内，影像科的超声数据与放射科的CT数据可能存在于互不连通的系统中。检验科的化验数据与病理科的活检结果，往往需要人工“搭桥”才能关联。第三，数据类型的“冰山结构”。可见的数据往往不到10%：结构化报告、视频流、操作日志等是隐藏的90%。“原始数据难触及，获取心电图原始信号、超声原始视频等比获取报告更难。不要说各家医院之间数据不能共享，就是同一家医院内部，分享数据也不是一件容易事。”段岩峰说，“而且高质量数据稀缺，获得和管理所需成本很高，且直接影响科研成果水平及业界地位，因此数据持有者分享动力不足。”

数据炼金术生态繁荣背后的隐形工程

数据质量决定了医疗大模型能达到的高度，也是生态繁荣的基础。为了提升数据质量，段岩峰团队采取了延伸战线的策略，即在技术研发的同时，深度介入临床数据治理和预后随访等数据相关环节，以解决“输入决定输出”的根本问题，而非仅仅聚焦于模型算法本身。这反映了医疗大模型落地过程中“数据工程是核心基础设施”的深刻洞察。临床数据治理尽管已经使用AI自动化处理数据，但目前阶段仍然采用“AI+人工”双轨模式“炼金”，通过人工复核最大限度消除数据误差，确保输入AI的训练数据准确可信；通过多轮次主动随访，将随访率从不足50%，提高到80%以上，提升数据的可用性。与医院系统内医疗器械来源不一、数据标准化差、质量控制困难的天然状况不同，图湃医疗的AI大模型的辅助诊疗系统首先基于自身设备，构建诊疗小生态。这意味着不同诊断设备的数据源于相同标准，格式互通、质量可控，在实现多模态辅助诊断时具有先天优势。

“我们首先通过设备的底层软件的平台化设计实现数据实时采集、自动分析、跨系统共享等；再通过云集影像系统建立数据中枢，也就是数据中台，存储和处理患者信息和数据，并评价数据质量。最后通过深度学习和自然语言技术，实现AI问诊。”王颖奇说。选择与头部专科医院合作获取数据可以事半功倍。图湃医疗选择与汕头国际眼科中心、上海五官科医院等已全面实现标准化电子数据管理的头部专科医院合作，保证数据来源的真实性、完整性和合规性。同时，这些医院的医生也接受过良好培训、具有丰富的诊疗经验，可以按照质量标准来采集医疗数据。“我们通过课题、临床合作的方式进行数据收集和治理，以医院为主体进行实施和监管，采用共建数据中心等远程合作模式，保证数据的流动性、可及性和流程合规性。”王颖奇说。“下一步，我们计划通过云集影像系统部署AI辅助，覆盖预防、诊断和干预全链条，实现从体检、预防到预后预测、术中干预和术后随访的全生命周期深度集成，让AI无迹可寻又无处不在。未来我们还将开放接口，帮助其他品牌产品接入AI生态系统，共同提高眼科的诊疗效率和水平。”

思维链之谜医学密码的破译路径

“医疗大模型对数据的要求是质量高、具有典型性和代表性，而不是数据的量级。”杨震说，“高质量的医疗数据收集固然重要，但构建和复现医生的思维链才是提高医疗大模型能力的关键。”医生的思维链就是其诊断过程。医疗数据如同“血液”，医生思维链才是决定“血液”如何流动、输送到何处的“心脏”。以前的技术无法复现医生思维链，现在大模型能够基于历史数据建立思维链。就像一位经验丰富的老中医，不仅能从脉象数据中读出病症，更能通过“望闻问切”的思维链条，将症状、病史、体质等碎片信息串联成完整的诊疗图谱。杨震认为，医疗大模型真正的突破，在于从专科大模型的积累，到全科的突破，以真正发挥AI的作用和价值。因为判断疾病和选择诊疗方案的关键在于根据表现确定病症，背后需要排查症状和疾病的对应关系，而不是单纯给出症状对应的治疗方法。就像好医生不会看到咳嗽就开止咳药，而是会区分干咳/湿咳、伴随症状等，形成诊断逻辑链。“当前大模型在多模态处理上仍存在明显短板，特别是在视频数据处理方面表现不足。”段岩峰表示，以超声视频为例，大模型无法对动态影像进行预处理，只能直接提交原始视频给心超专项模型进行分析，使得大模型的高智能水平在这一环节未发挥显著作用。这要求业界重点突破时空联合建模技术，开发专用视频处理架构，并构建医疗等垂直领域的视频预训练数据集，才能真正实现全模态无缝融合。如何让医疗大模型更“好用”“实用”？李航建议，在研发医疗大模型时应注意三点。一是推动AI专家与临床医生的深度融合协作，避免技术研发与临床需求脱节；二是建立全国多中心临床数据合作机制，通过跨机构数据训练消除单中心数据偏倚；三是坚持以临床实际需求为导向设计专科大模型，重点开发提升诊疗与研究质量和效率的智能工具，对患者和医生都有帮助作用。哪些疾病适合用医疗大模型辅助诊断？“应用AI大模型辅助诊断比较多的疾病一般都呈现明确的组织形态或病理性改变，可以通过病灶识别的方式，基于图像识别和标注技术建模和训练，可以实现异常识别，进行辅助诊断；并且这些疾病诊断有明确的标准或专家共识等。”王颖奇总结说，“就眼科而言，从眼眶、角膜、到视网膜和脉络膜疾病，从简单的像睑板腺障碍、干眼症，到复杂的像眼睑肿瘤、甲状腺相关眼病、感染性角膜炎、糖尿病视网膜病变（DR）、年龄相关性黄斑变性（AMD）和新生血管疾病等方面的辅助诊断技术目前均相对成熟。”

商业闭环痛产业发展的沉疴顽疾

模型性能、数据问题、伦理与信任、商业路径仍是阻碍医疗大模型产业发展的“疑难杂症”。

“AI大模型辅助诊断应用的阻力主要来自三方面。”王颖奇说。第一，在进入推广应用前，漫长的注册申报周期和极高的研发和临床资金投入造成了企业经营和决策困难。第二，无法解决收费难题，医院不愿承担额外采购成本。第三，患者难以接受在医院接受机器诊断的问题。“目前已经看到医保、药监等监管各方在努力解决AI商用难的问题，但这还远远不够，AI在医疗领域的广泛应用需要企业、医院和监管各方的共同推动，通过社会教育、体验活动让大家接受AI的存在和价值”。“应用医疗大模型在助力诊断时面临诊断准确性局限和法律伦理责任归属的双重挑战。”李航认为，大模型技术不断发展，已经从传统的卷积神经网络建模训练转向建设垂直大模型时代。AI在医疗行业的应用应该是覆盖临床全流程而非单点的突破，这需要大模型研发企业、医疗机构协作，但前提是需明确技术应用边界与主体责任划分。图湃医疗的OCT已经实现了视网膜疾病的相关病灶识别和异常提示、多病种辅助诊断，结合语言大模型实现了OCT问诊。目前可以诊断糖网、AMD（年龄相关性黄斑变性）、黄斑前膜、裂孔等疾病，同时由于图湃医疗OCT还有血流成像OCTA（光学相干断层扫描血管成像）功能，结合OCTA图像组成多模影像，可以进一步辅助诊断新生血管等其他疾病。目前正在注册申报阶段，尚未进入临床应用。AI医疗确实被视为最具商业化潜力的应用领域之一，但率先实现规模化落地仍需跨越诸多关键障碍。正如智能驾驶技术历经数十年仍处L2阶段，医疗AI的商业化也必将经历螺旋式上升过程。只有当技术成熟度、医疗需求痛点和支付方意愿形成“黄金三角时，预言才能真正成为现实。