数据资源作为重要生产要素蕴藏了巨大的价值,被认为是面向未来的数字经济的“石油”。正因为此,我国在2019年首次将数据与劳动、资本、土地、知识、技术、管理并列为六大生产要素。
2022年以来,有关数据要素市场化的新闻越来越频繁,尘封多年的医疗数据或许正在迎来“开采井喷”的关键点!
6月,河南省确定了6个要素的市场化配置改革试点。其中尤其提到了河南省数据要素市场化配置改革的试点工作将由郑州医保局完成,依托国家医保局大数据创新应用平台来探索数据要素的市场体系建设。
10月,浙江省标准化研究院等单位研究起草了《数据资产确认工作指南(征求意见稿)》,并向社会公开征求意见。这也是国内首个针对数据资产确认制定的推荐性地方标准,引起广泛关注。
江苏等地则通过数据应用大赛,通过为参赛队伍提供脱敏医疗数据以及安全合规的数据应用开发环境来探索医疗数据的流转及应用。
过去数年几经沉浮,进度难言理想的医疗健康数据应用挖掘,是否能够借助“数据要素市场化”真正实现突破呢?动脉网就此对行业人士进行了探访。
数据是数字经济时代的石油,医疗数据不能一直沉睡
尽管数据作为一种新的生产要素被视为数字经济时代的“石油”,但其价值不在于数据本身,而在于对数据应用分析所产生的洞见。因此,如果无法对数据进行有效地应用挖掘,这些数据也将会如同深埋地下的原油一般难以发挥。
这其中,医疗数据公认具有巨大的价值。临床诊疗、医院管理、疫情防控、医疗科技创新、医疗保险和患者等都可以从中获益良多。仅以国内医疗大数据解决方案的市场规模为例,2020年其市场规模为178亿元,估算2020-2026年的复合年增长率将达到39.3%,按此预计2022年市场规模将达到347亿元。
不过,不同于传统上将数据视为一种资产的观念。在未经处理无法产生价值的前提下,用负债来描述这些数据对所有方的价值可能更为精准。
仅从资产负债的角度而言,原始数据的物理存储实际上不是单纯的资产,也是某种意义上的‘负债’。数据在存储和管理层面都会对医疗机构和相关机构产生大量的经济成本,如果没有应用场景,确实负担很重。
2021年12月,国务院办公厅印发《要素市场化配置综合改革试点总体方案》,指出要在2022年上半年完成试点地区布局、实施方案编制报批工作,并争取试点工作在2023年取得阶段性成效。随即,各地纷纷开始相应的布局规划,也就有了本文开始的一幕。
然而,一个显而易见的现实是,医疗数据的应用现状并不理想,呈现出谨慎保守、孤岛效应和应用场景较少等特点。目前最为关键的是需要有明确的落地政策、主导机构及标准流程:“政策落地最为重要,医疗数据资产不同于其他行业的数据资产,其特殊性与政策休戚相关。只要政策明确,按照政策指导合法开展价值链上的各项服务或者通过数据资产研发市场化的产品是企业天然会去做的事情。“启益医疗在大数据和数字疗法上均有涉及,其COO洪蕾向动脉网介绍说道。
“从法律和合规层面,政府给出明确指导和要求后肯定可以解决目前大部分医疗数据应用上的问题。有了明确的政策后,可以在行业内形成‘良币驱逐劣币’的趋势——资质合格、技术过关、服务优质的企业能够合规地展开业务,更有市场效率和价值。”她补充道。
一方面,各种监管法规的密集出台为数据应用划定了红线;然而,在法规颁布并明确红线的同时却并未明确哪些事情可以做,如何做,使得数据市场化不具有可操作性。另一方面,现有的医疗数据质量普遍较差,距离商品化仍然有一定距离。
事实上,医疗数据的市场流转在全球都并不容易,面临各种严格的监管。
在数据市场化较早的欧美地区,医疗数据的应用已有一定规模,并发展出专门的医疗数据服务行业。通过为医疗服务机构提供PaaS服务,数据服务企业将大量数据变为可用性数据后利用人工智能或机器学习提供辅助决策支持。经过多年发展,这些领域聚集了大量的创业公司和巨头公司,主要有两种商业模式。
其一是向医疗服务提供者和保险服务方收费,通过大数据提供的决策支持为其带来更好的医疗结果和提高效率节约成本。其二则是为医疗服务机构提供免费或廉价的服务,然后通过后台收集的数据向药企等数据使用方收费盈利。
不过,医疗数据定价、流转和应用应寻找具有中国特色的计划性和有序性,不能盲目跟从欧美某个国家和地区的模式。“我国是一个全民医保覆盖下的社会主义国家,医疗保障制度有别于欧美体系,从体制上决定了我们的医疗数据的归属、权益、定价、流转和应用应该具有符合我国特色和全民利益诉求。”洪蕾表示。
正因为此,具有我国特色的医疗数据流转和应用模式或许需要在体制内进行探索和改革实践。仅仅进行数据的积累和管理但是无所应用,最后会形成国家的负担。因此有必要加速来设计、探索和改革实践新的应用模式。
据动脉网了解,目前已有一些采用全民健保医疗保障制度的地区在医疗数据市场化上进行了较长时间的探索,可以观察到实际产生的应用价值。这些地区的医疗数据应用主要依托专门成立的“全民健康保险保险人信息整合应用服务中心”实现。
这些探索开始于数年前,基于大型医疗机构提升运营水平为目标的数据需求,中心开始试点对医疗数据进行集中处理。通过该机构以及相应的立法,可以让公务机关包含产业应用的学术研究机构来申请健保资料,帮助中心进行AI算法加强的数据甄别和处理,比如说CT、MRI等影像数据都是透过深度机器学习模型的甄别处理。完善后的数据库则用于支持医疗机构用来分析医院的进货、出货、补药、耗材等管理,让医疗机构更加智能化高效率。
这些应用探索或许能够给我们一些启发。
医疗数据要素市场化为什么这么难?它会是撬动医疗数据的救星吗?
国家健康医疗大数据(东部)中心(下文简称东部中心)总经理王冰常年与数据打交道,对于医疗数据迟迟难以得到有效利用的原因有深入的认识。
她认为造成医疗数据难以得到较好利用的首要原因是数据零散分布在各个主体机构。政府、医疗机构、科研院校及部分健康医疗企业等机构组织在长期的业务中都有相应的健康医疗数据资源的积累,使其成为了各类健康医疗数据的实际拥有者和控制者。这直接导致了数据权属很难定义。
随着对原始数据的不断处理,医疗数据的权属变得进一步模糊。“比如,我们去医院做CT检查,原始的全量影像数据是一个数据集,在影像数据集一旦添加了医生诊断的内容,就生成了新的数据集了。”王冰解释道。
权属的不清晰将会导致如数据要素确权、治理、流转等一系列问题。更为关键的是,数据的采集工作将变得异常艰难。
“如果我们把数据资源认定为最底层的生产资料,在其交易之前先得加工成可供交易的产品——数据需要经过一系列的开采、汇聚、加工才能变成产品。虽然我们把数据和石油类比,但其实本质并不一样。石油的权属很明确,用一点就少一点。医疗数据所属的主体非常分散,医院、政府、院校、企业乃至个人都有一部分数据。另外,数据特殊的地方在于它不会用一点少一点,可以无限复用,甚至伴随数据的不断流转在各环节产生新的数据。出于对自身所控制资源的保护,各个主体给出数据的意愿不同。这都导致数据难以采集共享。”王冰向动脉网解释道。
其次,则是数据质量差异极大。在同一区域,三级医院、二级医院和基层医院所提交的数据质量差异非常大。究其原因,除了受设备、业务质控等影响原始数据生成质量差异外,主要还包括两点:信息化企业的数据采集标准和数据采集能力不一致。
“过去的信息化系统建设没有统一的指引,大家的标准不一样,支撑业务数字化的数据库结构也不一样。所以,当实施方(比如地方卫健委)想要采集特定数据时,就会发现生成这些数据的系统建设标准与库表结构各自不同,即便按统一标准采集起来,解读和清洗也非常困难。这是第一个原因。”王冰解释道。
“第二个原因则是采集模式不一致。比如三级医院和大部分二级医院是通过直接连通数据库的方式获取数据,数据质量相对有保障。但很多基层医疗机构受限于信息化能力不足,采用手工填报的方式。本身基层医疗机构的医生就不足,数据上报工作只能委托护士或者非医疗行业的人完成。这些群体填写的数据就会参差不齐。这就会导致同一个主体采集的数据质量差异极大,根据‘木桶效应’——质量差的数据入库就会将整体的数据质量拉低,变得难以利用。”她补充道。
事实上,尽管向公众开放居民健康档案数据的呼声很高,但现阶段推进节奏较慢的一个重要原因就是医疗数据的质量不高,假如不投入高昂成本做治理与加工,居民获取回流的健康档案数据很容易出现偏差。
最后,则是经济性问题。传统生产资料需要遵循“采集-处理-产品设计-销售”的路径。这一路径的经济性计算方式采用正向模式,通过计算路径中各流程的成本,再加上利润就可以得到最终的定价。
王冰认为,现阶段数据生产资源要素的经济性计算面临很大的难题:“数据价值确认恰恰很难按这个路径设计。结合前面的采集难和质量差异大的现状,在计算医疗数据经济性时就会发现没有办法精准测量与精细化控制前端(采、存、治)成本,市场主体去做数据半成品的加工工作的投入很大程度无法形成可以销售、获取足够用户市场的产品。就好像在沙漠里淘金粉,所有人都知道金粉值钱,但当淘金粉、加工金制品的投入、产品质量与市场预期都难以测算的时候,企业就没有投入意愿了,金粉就沉睡在沙漠中了。”
这样做或可加速医疗数据要素市场化进程
对于如何完成医疗数据要素的利用,王冰提出了自己的观点。她认为,各省要想把医疗数据作为生产资料,实现所有数据要素治理及流通,其必要前提是实施数字化改革,包括两个部分:打造“一个顶+一个底”的架构,通过数字化项目带动改革。
● 搭建“一个顶+一个底”的组织架构
一个现实是,虽然中央部门发布了很多发展数字经济、推进数字化改革的政策,但由于数字化改革是多个委办局智能治理思想的结晶,需要强力的政策牵引,大量的改革政策出台与落实单位在省一级。她表示,在当前国情下,比较现实的是由各省级政府与专业的数字化改革产业组织团队合作共建一个支撑行业数字化与数据服务的组织平台,搭建一个具备数字化公共技术能力和跨界产业服务能力的“行业专属数字化新基建”。
所谓的行业专属数字化新基建指的是产业互联网的技术公共支撑底座。数据服务则是利用数字化基建在主管部门针对场景的数据价值化项目审批、多个数字化项目规划实施、多方数据人才专业资源组织联动的基础上推进的产业赋能服务。
“卫生健康、医疗服务领域改革举措跟省级部门强相关。所以,我认为由省级来统一制定相应的顶层规划,确定一个全行业和全产业的数据资源要素的组织、获取、治理、供需撮合到带动产业链发展的整个组织平台是首要的第一步。如果这件事都没有做,那各方就是零散的,没有办法去实施。”
“这个数据资源要素改革化的支撑单位在省级层面也需要对应的领导专班和管理小组。因为医疗数据资源要素不仅是卫生行业管理部门的业务范围,也涉及到药监、医保、发改、工信、财政、网信和法律等一系列跨部门的协同,以及行业的引导标准规范等等。”王冰向动脉网解释了何为“一个顶”。
“我认为,在一个省域做好数据资源要素流通、组织、治理及发展的最关键的前提就是‘一个底’和‘一个顶’。‘一个底’是要建立一个组织平台底座,‘一个顶’则是要建立全省一体化的领导专班及相应的工作小组。通过两者的配合提出长期的未来规划,并落实分解到相应的行业规划和产业规划中去。”王冰补充道。
此外,新的组织机构需要保持与已有组织机构的兼容和协调。比如,一些省份已经下设分管全省政务类数据资源的大数据中心,其职责也涉及相应政务类数据汇聚、加工及流转等管理规则的出台。需要兼顾逻辑一致性才能在未来跟处于数据资源要素末端的大数据交易所进行对接。
完善组织机构建设后就可以与各种数据来源端进行沟通联系,并将这些数据资源组织起来汇聚到全省数据资产目录表里,并持续更新迭代。同时,还需要把数据资源要素治理所需要的各类人才(如专业的标注人才及各个细分领域的专家)、各方的数据资源、包括数据审计和数据中介等各种新型服务商,以及更重要的,将数据需求方组织起来。
“通过各方参与的共享共建,让真实的供需对接,持续去产生各种行业,比如便民惠民服务,医疗服务质量或管理效能提升;以及各种产业应用,比如面向AI,面向金融保险,面向新药研发等一系列服务,大量脱去原始数据敏感信息的数据集——很多地方称之为‘数据元件’——沉淀下来,成为可定价可反复交易的商品,最终输送给类似数据资产交易所等数据交易主体,推动规模化交易。这样,数据交易所才能进一步形成数据的定价、交易、税收等各种规则,并将全链条贯穿起来。”王冰总结说道。
● 通过数字化基建项目加速推动
不过,由于掌握主要诊疗数据的医院并没有足够动力分享数据,一旦难以实现目标,数据资源要素市场化的效果也不会理想。针对这一问题,王冰认为需要抓住关键问题予以解决:“归根到底,医院没有动力分享数据的原因其实主要有三个,其一是分享数据与医院的KPI与回报没有直接、明确的关联,其二是在未有明确的规则前这可能代表资产的流失,其三则是潜在的数据泄露风险。”
为了解决这一问题,还需要设法打通一个个“数据孤岛”。王冰介绍了江苏经验,即通过给全省居民带来好处的、提升医疗服务质量或者提升其管理效能的大型数字化项目的实施来拉动数据的采集,从而实现全省医疗数据的快速整合。
所谓数字化项目,指数字化基建上承载的围绕全省某一个领域数字化目标规划、统一实施的项目,通常包括某一个领域数字化目标范围内数据的采、存、治、用全链路实施。
这些数字化项目需要面向多方主体,以统一的标准去开展全链路上的数字化改造,如药械流通领域数字化改革项目、影像数字化与综合服务改革项目等。举例而言,江苏省的影像平台项目就是一个很好的尝试,可以通过几个步骤推动医疗数据的快速整合。
第一,是围绕医学影像领域全面数字化目标发布统一标准。“省级影像平台的第一步一定是先统一全省医学影像数据汇聚、安全管理、应用服务等的标准,全省所有医疗机构中进行相应的统一部署实施,把标准格式的数据从医院汇聚到中心。通过跨院调阅等应用加工,患者可以在任意一家医疗机构查看自己其他区域、其他医疗机构的历史病程数据,便民惠民。”她介绍道。
第二,由于数据已经实现了标准化,因此,汇聚到中心端的数据质量很高,可以形成一系列的数据集,进而支撑一系列行业应用开发,如支撑医保进行数字化监管,利用医保支付为抓手监管医院过度治疗,患者可以减少不必要的重复影像检查,降低对身体的影响。
第三,数据资源真正汇聚到中心端后,利用数据服务对产业创新发展进行支撑的步骤就可以得到简化。比如,依托中心端的数据资源结合公共技术支撑平台、开发环境开展人工智能辅助决策、创新药的研发等。
第四,一个数字化项目的全省实施可以把链接政府、数万家医疗机构、产业链的“数字高速路”建好,为数据采集、数据汇集乃至未来的应用整合营销奠定基础。
“这样一个具有实际价值的大型数字化项目可以实现多赢,不仅可以达到本身支撑行业应用的目标,比如惠民利民、提供医疗服务治理、提升管理效能,也是全省数据高质量汇聚的关键实践。通过多个项目的规划上线,数字化提档升级与数据服务的网络逐渐完善。再配合已经完成的组织平台和数字化领导小组的‘一顶一底’建立数字化服务网络推进产业互联,由支撑政府智能治理思想的落地,持续做大做强全省数据资源中枢、做好资产管理与服务撮合,将对应供需场景的技术配套与商业模式创新配套‘两手抓起来’,才能把一个省的整个流通市场最终打通。这是一个庞大的体系。”王冰总结说道。
目前,各省正就医疗数据要素市场化陆续出台相应的布局规划,并逐步落实。值得一提的是,虽然一定程度上的“百花齐放”更有助于我们在多种模式中找出更适合国内的方式,但各省标准不一导致新一轮“数据孤岛”的可能性并非不存在。这一隐忧或许需要更高层面在标准上的统一。
随着数据要素市场培育的加速推进,或许很快我们就能够看到医疗数据作为要素市场化流转的进展——当然,鉴于数据要素不同于劳动力、土地、资本和信息这类传统生产要素的特征,匹配数据这一生产要素市场化的较为理想的制度建设还需要经历相当长的过程。
就让我们拭目以待,那一天的到来。