数据交易,场内不香场外香。
作者 | 张怡
编辑 | 刘景丰
2022年8月6日,成立7年的贵阳大数据交易所,时隔数年后再次公布了累计交易额:突破亿元大关。这一消息,甚至登上了当天贵州日报的头版。
可把时间线拉长后,这个消息就不会让人振奋了。2015年4月14日,有着“全球首家以大数据命名的资产交易所”之称的贵阳大数据交易所(简称贵数所)正式挂牌运营,并完成首笔大数据交易。彼时,贵数所执行总裁王叁寿雄心勃勃,誓要在3~5年内将日交易额推到100亿元的规模。
但现实,狠狠打了他的脸。此后几年,贵数所的目标一改再改,从当初的“日交易100亿元”变成“全年力争突破亿元”。但这个目标,也定得过高。从2018年起,贵数所甚至不再通过官网等渠道公布交易额。
贵交所的处境并非个例。「甲子光年」根据公开信息不完全统计,目前全国在建或已揭牌的数据交易所有41家(地方政府主导的数据交易所、数据交易中心、数据交易平台,在本文统称为数据交易所),这些交易所平均注册资金接近1亿元,且多为政府主导。
其实数据交易,在数交所出现之前就存在已久。最初这只是一些企业间的商业行为,但由于缺乏监管和法律约束,导致数据黑产、个人隐私信息被滥用等问题。而大数据交易所,正是地方政府为了解决这一问题而建立的。它为数据交易提供场所和设施,并对交易过程进行监督和审核,最终目的是发展数字经济。
然而讽刺的是,七年里真正在数交所成交数据的少之又少,南都大数据研究院4月研报显示, 目前数交所在我国数据交易市场中所占份额不足5%。 没有交易、甚至没有产品成了许多数交所的真实状态。相与场内交易形成鲜明对比的是,不受数交所约束的场外交易规模屡创新高。
数字时代的洪流之下,是什么困住了数据交易所?
1.1年半,新增了15家数交所
数据交易所,尽管名字让人陌生,但实际上它的模式与证券交易所颇为相似:它们都是集中交易生产要素的地方,由政府负责监督管理;而且数交所引申出的许多概念,如“挂牌”、“数据经纪人”等都能在证券市场找到一一对应的影子。
另外一个容易与之混淆的名词是数据中心。实际上数据中心是存储和计算数据的地方,它是云计算的载体;而数据交易包含数据储存、数据交易等功能,在经过审核的情况下还能吸纳各类政务、商业、公共数据,并撮合数据买卖双方达成交易,让数据实现商业化。
从2015年至今,国内的数据交易所发展经历了两个小高潮:
一是2015~2017年,共有20家数据交易所注册成立,其中2015年一年便有10家;此后2018~2020年回到低谷期,只有6家数交所注册成立;
二是2021年至今,有15家数据交易所先后被批复或注册成立。
数交所的再度走热,一方面得益于数字经济、产业数字化受到前所未有的重视,另外还得益于政策的支持。某数据交易圈人士对「甲子光年」表示,每当有数据相关的新政策出台,各地的数交所及其数商(参与数据流通交易各个环节的企业和机构)都会兴奋一阵子,但是随着政策热度褪去,行业又逐渐回归平静。
尽管数量暴增,但实际上成立一家数交所并没有想象的那么容易。根据天眼查的数据,现有数据交易机构的注册资本在30万元至8亿元之间,平均注册资本金近1亿元。其中,注册资本在1亿元的有7家,其次注册资本为5000万元,也有6家。值得一提的是,近两年成立的北京国际大数据交易有限公司注册资本为2亿元,上海数据交易所有限公司注册资本8亿元。
除高额注册资本外,数据交易所的设立和运营也有极高门槛,且不说交易所的资质,单是场所和设施的建设就耗资不菲。数交所的设施包含IDC机房和交易平台等,此外还需要搭建数据治理、数据经纪等团队。河北日报曾报道,河北大数据交易中心在2015年启动时的预算为2亿元。而一名数据交易从业者也对「甲子光年」称,此前东部某数据交易所举办一场大会就花了700万。
按照「甲子光年」不完全统计,目前全国在建或已揭牌的数据交易所有41家,这些数交所的建设投入将是数十亿元的规模。
巨大的投入却未换来期盼的效果。贵交所成立7年累计交易才破亿元,德阳数据交易中心成立半年至今交易额为257万元,而其他数交所几乎就没有公布交易额的了。
在上海数据交易所官网上,“产品”菜单下虽然展示着近百个数据产品,但数据产品既没有详细介绍,也没有报价,甚至也不能点击交易,更没有成交量展示。
北京国际大数据交易所等也均有类似的情况。
华东江苏大数据交易中心政企服务部总监谭坤告诉「甲子光年」:“数据交易所的理想状态当然是和证券交易所一样,让所有的数据都通过交易平台进行交易,一方面更容易审核数据交易的合规性,另一方面也能帮助各行各业通过数据应用实现降本增效。”
但对于数据交易而言,协调和撮合数据供需方却是一项相当困难的工作。 因为数据交易定价没有股票连续竞价那么简单,介于数据的可复制性,以及在不同场景下的价值差异,市场上还没有一套公认的定价机制。某数商告诉「甲子光年」,现在不管场内(数交所内)还是场外(数交所外)的数据产品成交价格主要取决于商务协商,成交额有高有低,属于一个愿打一个愿挨。
这就使得,原本为了规范数据交易的数交所,并没有发挥它的价值和作用。
2.尴尬的数据交易:场内不香场外香
一项数据显示,2020年国内大数据要素市场(含数据清洗、标注、交易等环节)规模达545亿元,但场内数据交易只占总体交易市场规模的4%。
一年多之后这个状态似乎仍未有多大改变。南都大数据研究院今年4月研报显示,目前数交所在我国数据交易市场中所占份额仍不足5%。
与之相对应的是,场外黑市上的数据交易却异常活跃。《证券日报》曾在今年初报道,我国数据黑市交易的市场规模已经超过1500亿元。活跃的数据黑市,导致了网络爬虫爬取隐私数据、数据泄露等事件频发。2018是数据泄露大年,彼时美国纽约时报曝光了Facebook 8700万用户数据泄露,招聘网站前程无忧195万份求职简历遭泄露并涉及蓄意倒卖。
某业内人士向「甲子光年」透露,第一批(2015~2017年)成立的数据交易所也曾上架过通过网络爬虫方式得来的数据集。后来,随着《数据安全法》《个人信息保护法》等法律法规落地,爬虫产业上诞生的大量数据产品便归入了不合规序列,被清出场内交易平台。
从理论上讲,场内数据交易机构的资源更丰富,具备构建规则、搭建生态的能力,还能提供数据合规、数据建模、数据分析等增值服务,而且业有内人士告诉「甲子光年」,现在80%的地方数据交易所都免费吸引数商入驻。
但是为什么从2015年至今,地方数据交易所的数据交易一直没做起来?
原因主要有三个方面。 一是数据交易所缺少运营。 从目前各家数交所的网站上可看到,不仅数据产品数量少,而且种类也不够丰富,有些数据要么比较鸡肋,比如政府公开的数据;要么则涉及安全敏感,不允许开放。
2019年,山东省内某大数据交易平台负责人就对媒体讲述了其遇到的一个问题:曾有一家家电厂商出价一千多万元,向交易平台购买包括温度、湿度在内的全国300个重点城市过去三年的气象数据,以辅助产品设计,提高家电产品使用寿命。但这个买卖其实有价无市,数据交易平台做不了——因为,尽管气象部门每天会公布天气数据,但过去三年300个城市的整体气象数据属于国家战略资源,不能对外公开,也就无法自由交易。
还有一个例子。某银行IT部门主管曾向媒体透露,由于地方数据交易所缺乏统一的数据确权标准,他们的数据采购订单经常因为数据提供方无法自证不存在过度违规收集行,或数交所无法提供数据合规担保证明被叫停。
数据的种种限制,就引出了第二个方面, 数交所还没探索出清晰的盈利模式。 目前的数据交易所多是政府主导,企业和风险资本涉足较少。但数据交易所本身是一个很重的产业,既要有人员和基础设施的投入,又要兼顾运营和技术突破,对资金的需求量不可小觑。盈利能力不足,也制约了数交所的运营能力。甚至许多数交所的成立本身就是为了完成政绩,而不是真正的用于数据交易。
然而,数据交易所却鲜少传出融资消息,仅有上数所在5月完成融资2亿元这一条公开信息。是数交所不缺钱,还是融不到钱,或者现阶段不需要更进一步投入?至少,从各数交所官网运维欠佳,以及联系客服难度大的情况看来,数据交易所距离扩大市场规模和盈利似乎还差得远。
第三, 场内交易的数据还未搭建起成熟的应用场景 ,在基础设施完善、商业模式能跑通之前,没有数据应用场景的数交所很难吸引到数据供需方的,况且与场外交易相比还有额外审核流程,得付出时间、金钱成本。
值得注意的是,目前很大一部分合法的数据交易也是绕过数据交易所一所达成的,因为数据需求方可以直接联系供给方,通过数据交易所交易的动力不大。华东江苏大数据交易中心谭坤表示,很多数据产品的甲乙双方都非常明确,数据交易所只能通过鼓励的方式让供给方把产品在场内上架,但他们来场内交易的主观意愿其实并不强,数交所对此也很无奈。
而且,数据产品还有一个特殊之处,不论在内容上还是在形式上都很难实现标准化,不同需求方对于同一数据源也很可能存在各自的定制化需求。
某业内人士指出,“数据交易并不是像土地、房子交易那么简单,成交之后权益都属于买家。数据的复制性很强,这就导致数据产权难以界定,数据价值不好判断,再加上数据安全、隐私泄漏等一系列问题,导致数据要素的场内交易发展得不尽如人意”。
3.新型数交所,到底新在哪儿?
2021年3月底,北京国际大数据交易所(下称北数所)成立时,打出了一个新的标签——国内首家新型数据交易所。
根据当时的报道,北数所的创新之处是, 打造了基于“数据可用不可见,用途可控可计量”的新型交易范式 。简单理解,它采用隐私计算、区块链等手段,将数据所有权、使用权、隐私权分离,解决了数据交易中的隐私和安全问题。
此后,上海数据交易所、广州数据交易公司、深圳数据交易所等也相继揭牌或宣布筹建,且均要成为新型数据交易所。
尽管模式有创新,但他们面临的问题并未得到解决。“ 地方数交所在今天遇到的问题,与6年前并无二致。 ”某资深数据从业者表示。
核心还是运营。过去数交所的运营思路非常简单,不外乎“拿来数据-展示数据-撮合交易”。数交所在运营上的难题,主要源自数据交易需求与发展初期数交所能提供的服务不匹配,比如前文所述数交所提供的数据鸡肋和敏感等。
此后随着不断试错和探索,数交所们开始迭代自己的运营方法。以江苏华东大数据交易中心为例,自2018年起开始了会员制和线下转线上的运营思路调整。
谭坤告诉「甲子光年」:“我们目前是全国唯一一家以增值服务会员生态模式去打造生态圈的数交场所。”一方面通过市场化的数据交易配套服务增加客户的黏度,另一方面通过搭建丰富的峰会活动、行业论坛、沙龙等互动交流平台协助会员提高曝光度。
按谭坤的说法,在会员生态以外,华东大数据交易中心还会利用会员活动和日常信息发布,引导买方和卖方在线下找到合作对象。“本来我们担心线下交易会导致会员绕过平台直接进行场外交易,但通过和上海大数据交易所沟通,我们也认可数商认证、合规评估报告、线下交易的好处。”
他提到的数商认证体系,正是上海数据交易所探索的运营新模式。此外,北数所也提出了“数字经纪中介”模式,以及广东佛山在辖区试点数据经纪人模式。
“数据交易网”创始人张瑶曾撰文对这三类运营模式做过分析:数字经纪中介并不直接参与交易,只提供交易撮合、专业咨询等服务,旨在于提升交易质量、提高交易效率,进一步促活市场活跃度;数商的范围更大些,既包括各服务机构,也包括数据的供需方企业,是组成数据交易体系的重要参与集合体,各交易所对“数商”也各有侧重,有些侧重于数据提供方,有些侧重于数据交易的服务方;而佛山在全国首批推出授牌数据经纪人模式,特殊之处在于经纪人均在政府的监管之下开展数据经纪活动,其既要数据运营能力、监管能力、技术实现能力,还要具备生态协作能力。
商业主体、数据服务机构的参与,一定程度上能够解决数交所此前面临的数据运营难题。短期内,场内的数据交易仍然吃力不讨好,但长远看,新型数交所的量变已经为数据交易的质变打下了基础。
4.新的命题:如何盘活数交所
数据显示,2021年我国大数据产业规模已突破1.3万亿元,而工信部在《“十四五”大数据产业发展规划》中预计,到2025年我国大数据产业测算规模将突破3万亿元。
这是个极大的盘子,而数交所是这个盘子激发活力的关键节点之一。
因此,激发大数据产业活力的重任,就落在了数交所身上。而这第一步,就是盘活数交所。
首先是破除国内各数据要素市场的不协同。 举个例子,一个客户要采购全国各地的交通数据,他得分别入驻各地方数交所才有可能进行交易,而且各地方的交通数据也存在差异,导致应用方在数据整合上也会遇到阻碍。
谭坤表示,解决这个问题,有两个核心思路:一是打破地域限制,按行业划分特色的数据交易平台,比如建立全国范围内的交通数据交易中心,并作为地方数交所的特色高频数据交易产品;二是允许数据产品在各数交所同时上架,产品互认。各方在合规、运营体系、利益分配达成一致的前提下,让优质的数据产品更好地在合规的交易场所快速流动起来。
其次, 隐私计算技术在现阶段的瓶颈也是各地方数据交易所面临的问题。 一方面,算法协议目前尚不能保障数据交易的绝对安全;另一方面,不同机构部署的隐私计算产品都有一套自己的逻辑架构,很难实现信息交互。
京东科技数字城市群城市操作系统负责人莫雄剑告诉「甲子光年」:“隐私计算是一类解决方法的总称,但目前来看单一的联邦学习或者多方安全等技术路径并不能独立解决所有数据安全问题,目前阶段想要最大化保障数据安全流通,可以考虑依靠多种隐私技术路径组合使用的形式。”
以北数所为例,北京国际大数据交易所IDeX系统是依托隐私计算、区块链及智能合约、数据确权标识、测试沙盒等领域技术构建的新型数据交易系统。京东科技、华控清交、微芯感知科技作为北数所的股东和技术提供方,分别以联邦学习、多方安全计算、区块链技术路径共同支持北数所的隐私计算方案。
莫雄剑还表示,虽然隐私计算还没到成熟期,但这门技术的出现让被认为“太敏感”的数据重新获得了在要素市场上流通的可能,再结合数据交易所中立、权威的立场,很有可能让数据资源最大化交易价值。
最后, 数交所盈利难、产品少、运营困难背后的根源,是数据确权难、法律制度的不完善。
虽然《数据安全法》立法层面上肯定了个人和组织对数据享有权益,但并没有给数据财产所有权一个明确的定义,这也直接导致数据定价难的问题。
上海协力律所合伙人江翔宇告诉「甲子光年」,虽然目前数据的权属法律界定仍有待完善,但法院和仲裁机构面对这类纷争也有办法,“在现实实践中,纠纷双方的书面合同将成为仲裁方界定权利、义务的主要依据,数据权属的明确界定应该会回避。”
如果数据权属的范围得以明确,未来也应出现专门为数据交易服务的数据产品合同,届时定价问题也会迎刃而解。
交流的最后,一位从业者感慨:此时此刻,数据交易所面临的难题就像一座座大山,让人不敢想象;但若能等到彼时彼刻,技术、制度、安全等问题全部得到解决,那个数据真正实现自由流动的世界,也许同样会超出所有人的想象力。