医疗数据交易市场,正逐渐活跃起来。
12月24日,广州数据交易所完成首款医学检验数据产品的场内交易。本次达成交易的数据产品是一份乳腺癌大数据分析报告,买方是一家专注于医疗险的国有企业。
医疗数据具有巨大价值,能被应用于疾病研究、新药研发、医疗保险开发等诸多领域,一度被誉为“沉睡中的金矿”。然而,现实中,医疗数据不仅分散在互联网平台与医药企业,而且“走”不出医院机房,导致数据要素的巨大生产力未能得到释放。
究竟是什么因素阻碍医学数据的流动?一批批数据产品上架交易所,是否在预示着“沉睡的市场”正在被唤醒?
图源:新华社
图源:新华社
最大卖方
一场交易,有卖方,也有买方。纵观全国,在医疗数据交易活动中,最大卖方是医疗机构。
5月,广东省人民医院上架了首批2项健康医疗数据产品——“广东省医学科学院糖尿病视网膜病变诊断数据产品”与“广东省医学科学院心脏疾病诊断预测数据产品”;6月,上海数据交易所宣布上线了全国医疗体系首批合规、可交易的数据产品,本次挂牌数据来自上海市第一人民医院眼科、内分泌科、放射科等10个科室及上海申康医院发展中心行政管理部门,包括20个重大疾病数据产品和1个医疗行政数据产品;10月,广州医科大学附属妇女儿童医院上架了新生儿黄疸数据产品,获得全国妇幼医疗体系首张数据资产合规登记证。
“大型医疗机构医院拥有海量的数据。”金域医学副总裁李映华分析,上架交易所的产品,既有数据分析报告、算法与模型、数据地图,也有一些脱敏处理的原始数据。但无一例外的是,这些产品都经过了数据的匿名化处理及安全加密。
谁在买数据?
这一次达成交易的是一家聚焦于医药险领域的健康科技公司——国药控股旗下上海宸汐科技集团,公司将把乳腺癌数据产品用于商业保险的开发。李映华说,除了用于保险产品开发外,数据资产可在基础临床研究、器械及新药研发、医疗服务、公卫监测预警、AI模型训练等多个场景应用中发挥关键作用。比如,药企看重的是药品在临床世界的使用情况,并以此来倒推前端的研发;在人工智能大模型设计时,医疗数据便是“食物”,没有食物来源,大模型根本就“长不大”。
“清洗”低质量数据
上市交易的数据产品,相比于沉睡中的海量数据,只不过是冰山一角。多年来,医疗数据“躺”在医院机房与后台,流通起来更加是难以企及。
当医院管理者想要布局一些数据业务板块时,他们首先看到的是质量不高的数据。
在信息化高歌猛进的阶段,医院全力“扑”了上去。广州一名三甲医院信息科负责人杨明(化名)说,大多数医院都拥有十多个信息系统,比如是电子病历系统,影像管理系统和药物管理系统等,这些系统的搭建时间各异,且供应商不同。这一特点就注定了它们之间的数据是没办法相互连通的。
因此,想得到高质量的数据,医院就要花费大量时间成本清洗和整理数据,“有时它的清洗治理成本要远远大于它能产生的价值。”杨明说。
发展数字资产业务并非是一些医院发展的重心。一名三甲医院主管医疗的副院长表示,当前许多医院经营重点在住院量和门诊量,考虑如何留存和转化病人,但对于一些高水平医疗机构,挖掘数据就成为医院发展的“自选动作”。
李映华介绍,自从认识到数据价值后,公司就组建一支来自数学、IT、数据、医学等专业领域的人才团队,负责实现数据清洗和标准化,尽管企业在数据处理上更灵活,但等到需要验证数据准确性的时候,就发现真正的难题——高素质数据人才的短缺,懂数学,也懂医学的人,更是少之又少。
高质量的数据是成功交易的第一步。广州市卫生健康委员会信息与统计处二级调研员华军称,广州将统一全市卫生健康数据标准,开展数据汇聚、数据加工、数据产品跨行业流通交易和大模型训练等工作,进一步释放卫生健康数据价值。
确权之困
在围绕医疗数据的讨论中,一项争议便是数据的产权归属——换句话说,究竟谁拥有数据的完整产权?事实上,对于数据的归属权,目前全球仍然没有形成较为统一的观点。
中国社科院公共政策研究中心特约研究员贺滨在接受媒体采访时表示,医疗数据所属的主体非常分散,涉及到个人、医院、企业乃至政府,且同一个患者的数据可以被多个主体留存、复用和更新,根本无法追根溯源。
广州实验室教授、博士生导师李亦学支持健康医疗数据公有化。他认为,目前从某种程度上搁置医疗数据所有权的争议,只要政府和机构在合法获取数据的前提下,就能享有对数据的处置权,只有这样才能更好推动医疗数据的发展。“若是纠结产权的问题,这事就没有办法做。”他说。
地方政府数据交易中心的成立,为医学数据的合规交易与流通提供一种可能性。李映华介绍,在数据产品上架前,广州数据交易所就邀请律师团队完成数据加工权、经营权和持有权的确认,“相当绕开了所有权的争议,很好地保证交易的合法与合规。”
着眼未来,当数据交易市场足够活跃时,是否会存在不同主体之间的产权纠纷?
市面上出现了一种“共享产权”的方式。杨明说,为获取高质量的诊疗数据,部分数据服务商往往会和医院达成共同开发某款大模型应用的协议,并承诺使用保密级别最高的国密算法加密,确保数据全程不可见,不出院。作为条件,开发出来的大模型产品,医院不仅可以免费使用,还能拥有部分知识产权。
至于患者与医疗机构的产权问题,李亦学认为,当市场成熟时,患者也许有可能不向医疗机构提供隐私数据,此时就需要医疗机构与患者达成某种协议,才能推动数据获取与采集。
信任之惑
在人工智能浪潮下,几乎所有人都看好数据交易的赛道,却始终有一丝犹疑。因为数据交易涉及的是安全与隐私。一名数据的卖方就坦承,在很多时候他们会对数据的买方进行资格审查,最大程度上确保不会造成生物信息泄密和国家安全等问题。
理论上来说,洗去所有身份信息的匿名医疗数据就能够在市面上合法流通,然而在现实中仍旧存在不少灰色地带。报道指出,2023年,最高检曾披露医疗信息泄露典型案例:2021年以来,部分保险代理机构与江西省宜春市中心城区5家大型医院达成协议,保险人员通过合作医院违法获取大量患者的姓名、手术类型、联系电话等医疗健康信息,对相关患者进行保险推销,患者不堪其扰。
在我国,《“数据要素×”三年行动计划(2024~2026年)》指出,要制定完善数据内容采集、加工、流通、应用等不同环节相关主体的权益保护规则,完善个人信息匿名化使用规则,在保护个人隐私前提下推动个人信息利用。
李亦学指出,各方对参与主体身份、资质存在疑惑,且提供方无法有效控制、记录数据流程全过程,导致数据滥用、泄密和篡改风险颇高。他建议,在数据的采集、汇聚、清洗、分析、销售、购买、应用等全过程中,必须强化管控,确保数据的安全可用。只有这样,大家才愿意共享和共用数据。
有人说,医疗数据资产化能催生出一个千亿级市场。李亦学则表示,现在还在一个很原始的阶段,需要一定时间才能形成成熟的市场,但不能因此停止发展,要在发展中解决问题,寻找各方利益的平衡点。
南方+记者 黄锦辉
订阅后可查看全文(剩余80%)