数字金融时代的到来,互联网金融、替代数据发展,为金融机构的客户拓展、风控体系、信用评估带来效率上的挑战。第三方平台助力金融机构提质增效的同时,也带来了违规采集、越权使用、数据失真、隐私泄露等问题。如何将征信数据治理作为抓手,充分发挥征信对市场的底层支撑作用并引领市场发展,成为当前的重要课题。
一、统一大市场:征信数据治理新导向
2021年7月,中国人民银行征信管理局给网络平台机构下发通知,要求网络平台实现个人信息与金融机构的全面“断直连”,各互联网平台纷纷采取举措,围绕征信公司中介作用,打造新业务模式。主要为以下方面:
一是风控数据通道模式。通过直连API而非征信机构中转,实现放款和贷后信息,客户点击用信按钮后在线签署贷款协议,放贷机构启动放款并将放款状态、贷款要素、还款计划等信息实时或批次同步至助贷机构进行前端展示,后续还款履约信息采取同样操作。
二是风控技术产品化。该模式主要通过两种路径实现:一是征信机构在自有安全域中开辟一块区域,专门部署承载着助贷机构模型和策略的决策引擎,入模入参变量均由征信机构从一手数据源获得,投入决策引擎并形成决策动作输出给放贷机构,助贷机构获取“知识产权”的使用费。二是运用可信执行环境(TEE)或联邦学习(FL)等隐私计算技术,确保其它参与方无法获悉助贷机构模型和策略前提下获得计算结果。
三是直连跳转模式。助贷平台全程未与客户有任何信息交互,仅提供信贷产品广告界面和贷后信息展示界面,避免诉诸征信机构。
此次“断直连”主要解决三个问题:一是互联网平台不能进行信用评分;二是替代数据不能交易;三是银行业自主风控。在数据收集边界、非人格数据交易、数据收集割裂、收费模式等方面未予明确。因此,可以预测,数据交易场所模式是未来征信数据的发展方向。主要依据如下:
(一)数据安全不能成为数据交易充分条件
数据交易是数据管理决策权与收益权的统一。数据治理不仅是技术问题,其根本在于数据管理决策权和收益权的分配。数据管理决策权赋予企业在一定规范内收集、整理数据的权力,目的是提高企业自身的经营效率,而非收益。数据收益权是数据交易的充分条件,而数据交易的标的是衍生数据,是底层或原始数据经技术处理过的数据产品,因此,数据管理决策权是数据交易权的前提之一。
(二)数据源割裂不利于数据基础设施建设
打造集约数商生态,助力建设征信数据基础设施。大数据征信具有高效性、海量化、多样性、高价值等特点,有效数据的采集场景不由线下公共服务部门场景转移至电商、社交等互联网线上平台。征信机构需要对接不同部门和平台,建立广泛的数据连接,形成数据聚集效应,以在行业中占据优势地位,进而打造征信数据基础设施。然而,上述数据的采集场景是互相割裂的,容易形成数据孤岛,且数据源存在一定程度的散乱。通过互联网平台提交的“断直连”整改方案可以看出,不同的征信公司代表了不同的立场,无论是数据移交还是征信评分上报,数据源都存在一定程度的争夺,数商为获得征信公司的官方增信,与征信公司不断深入合作,会持续付出较大的成本。松散的数商共存模式是阶段性的,未来可持续的数商生态应以集约、高效的官方数据交易场所为发展方向。
(三)数据歧视扰乱市场竞争
数据歧视的概念借鉴了经济学中的价格歧视概念,数据提供商在向不同的接受者提供相同等级、相同质量的商品或服务时,在接受者之间实行不同的销售价格或收费标准,或者相同的服务标准下,提供质量差异化的数据或信用服务。目前,各互联网平台的征信服务信息综合了用户的信用历史、履约能力、行为偏好、身份特质、人脉关系等五个维度。征信公司作为征信评估结果传送枢纽,缺乏数据决策管理权,各数据平台由于没有统一的数据采集和处理规范标准,存在数据录入错误、信息缺失、冗余重复、信息主体不明等问题,容易导致数据歧视的发生。数商围绕征信公司展开角逐,可能存在的数据污染使金融机构既无法彻底断绝与“断直连”前互联网平台的绑定,同时又亟需搭建自主风控体系。
综上,此次“断直连”解决的主要问题是干扰市场公平竞争的乱象,以征信公司为中介的整改方案及衍生的各种经营模式将作为一种过渡,形成统一的数据交易场所将成为下一步的方向。
二、场内交易所:征信数据交易新模式
数据源更高的合规要求、对数商平台数据决策权的资质要求和数据要素流向的公平、标准化要求,提高了数据交易合作的门槛,场内交易所成为金融征信数据合规发展的一种可行路径。
(一)替代数据:符合场内交易所的规范发展
大数据征信信息不仅包含传统的个人信息及征信数据,还包括用户留存在互联网中的信息,包含税务、医疗、消费、缴费记录等数据,体现了个人的消费、性格、社交等属性,这些统称为“替代数据”。应建立数据采集标准化、最小、必要统一管理原则。
(1)编制征信替代数据采集目录,构建采集指标体系。长期以来,各互联网平台关于类征信数据的采集范围和指标变量均自成体系,这也是征信公司短期无法搭建平台体系的关键所在。应构建清晰的数据采集目录和采集指标,推动数据管理和场内交易所的建立及高效运转。
(2)建立数据资源池。征信交易所需按照标准目录及指标将各数据平台上报的数据纳入资源池统一管理。金融机构在使用涉及金融相关的业务数据时,仅向交易所申请提取并付费,从而与互联网平台彻底“断连”。同时,交易所动态调整目录内容,及时添加新变量或删除旧因素,维持替代数据指标体系的合理性和有效性。
(二)场内交易所:征信数据交易模式
从数据的采集、应用、监管等三方面构建通用的替代数据管理框架,探索建立替代数据交易所模式(如图所示)。
图 征信服务的交易所模式
第一步,征信数据交易所搭建多源异质数据资源池、数据规范集合、数据仓等模块;第二步,数商平台将数据有偿输送到交易所的多源异质数据资源池;第三步,交易所将数据按照标准整理,剔除冗杂指标,形成规范数据集合,并将数据标准化输送至数据仓;第四步:金融机构按需有偿获取数据,并利用自主风控模型进行信用评估。
数据交易所模式实现了数据采集边界统一、数据应用规范统一、数据交易管理统一、数据监管体系完善。
三、需要进一步解决的问题
金融数据的交易所模式解决了征信数据滥用、数据垄断、数据歧视等问题,丰富和完善了现代征信体系,积极引导征信替代数据的规范发展,将大力促进我国社会信用环境改善。但是当前监管和交易的实践路径与数据交易所模式还存在较大的差距,部分底层逻辑问题仍需讨论解决。
(一)征信数据的所有权和交易权
学术界和实务领域关于数据的所有权没有明确定论,当前争议颇多,在一些情形中,如消费者因消费、娱乐等因素不得不注册填报个人信息,却无法享有数据管理的决策权和收益权,在法理和经济学逻辑方面存在一定的不公平与不合理性。在数据确权基础上确立收益权并实现可量化是亟待解决的问题。
(二)征信数据交易收益分配模式
在明确所有权和交易权基础上,亟待对征信数据交易收益分配模式进行规范。当前对交易模式的探索存在多元化趋势,在收益分配方面未予明确。数据交易平台是否享受劣后收益,对数据质量如何把控,数据平台如何进行成本补偿,这些问题都需要进一步厘定。
(三)征信数据的定价机制
2019年10月,党的十九届四中全会通过的《中共中央关于坚持和完善中国特色社会主义制度推进国家治理体系和治理能力现代化若干重大问题的决定》提出:“健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制。”因此,数据要素的定价问题亟待深入探讨,进而评估数据在金融活动中的价值创造。