国务院办公厅近日印发《要素市场化配置综合改革试点总体方案》,明确到2023年数据要素市场化配置基础制度建设探索取得积极进展。到2025年基本完成试点任务,要素市场化配置改革取得标志性成果。
此次方案为我国数据要素市场的建立提供了清晰的目标和路径。在探索建立数据要素流通规则方面,方案直接采纳了业界普遍认同的数据交易和使用原则,包括数据交易的“原始数据不出域、数据可用不可见”,数据使用的“可控可计量”等。
方案还明确,规范培育数据交易市场主体,发展数据资产评估、登记结算、交易撮合、争议仲裁等市场运营体系,稳妥探索开展数据资产化服务。
我国在数据交易方面的探索已近10年,随着政策和立法的推进,越来越多的数据已从私下交易模式转向市场化交易模式。2021年北京国际大数据交易所和上海数据交易所先后揭幕,成为我国新一代数据交易所的典型代表,实际上已经在机制和技术层面持续践行上述方案所提及的各项原则。
2014-2022
八年探索孕育出的新型数据交易方式
2015年4月,中国有了第一家大数据交易所——贵阳大数据交易所,随即开启了全国范围内兴建大数据交易所的热潮。然而彼时对数据交易所这个全新事物,谁都没有足够认识,更无经验借鉴,一拥而上的结果只能是暴露问题。
据中国信息通信研究院和重庆市大数据应用发展管理局编写的《数字规则蓝皮报告(2021年)》,2014-2016年间全国各地先后成立13家大数据交易所(中心、平台),但由于数据交易所的定位和模式未明,数据交易配套的法律缺位,数据交易处于小规模探索期,成交量远低于预期。
国内大数据交易所建设历程 来源:《数字规则蓝皮报告(2021年)》
与传统金融资本类交易所不同的是,我国没有在法律和政策层面要求数据交易必须通过大数据交易所来完成。在相对可信的前提下,数据买卖双方私下直接交易仍是主流。而在信任缺失的情况下,大数据交易所在法律和商业层面也都不具备足够能力让买卖双方信服。
复旦大学教授、上海市信息化专家委员会成员黄丽华指出,一直以来我国数据流通与服务处于未完全合约化阶段,存在缺乏数据确权机制、缺乏交易规则及制度规范、缺乏数据的制度性供给、缺乏数据流通的多元化主体四大障碍。
大数据交易所的窘境在2018年后迎来了转机。欧盟《通用数据条例(GDPR)》的生效让全世界都深切意识到,数据安全与隐私保护再也不是形而上学,而是巨大的商业风险、不可回避的合规需求以及真金白银的成本投入。
当私下的数据交易可能面临更多合规甚至违法风险,合法合规的数据交易平台自然就成为对冲此类风险的工具之一。
另一个转机来自于数据价值的爆发。我国于2020年正式把数据列为生产要素,并提出推进数据要素市场化配置,数据交易所作为数据汇集和流通的理想平台,再度迎来利好。还有观点认为,通过设立大数据交易所实现数据的汇集、流动和共享,可以打破互联网平台对数据的垄断。
此后,各地再次掀起建设数据交易平台的热潮。2021年3月,北京国际大数据交易所成立。2021年11月,北方大数据交易中心获批,上海数据交易所揭牌。
第一波交易所只专注于数据买卖双方的撮合,无法满足新阶段数据交易的要求,只能算初创1.0版,而新一轮2.0版的交易所更注重发挥数据要素的价值,并且尤其关注数据安全需求,顺应了时代趋势。相比1.0版,2.0版交易所在认知与实践层面有了几大显著升级。
首先是数据要素新价值。伴随大数据的广泛应用,人们对数据价值和数据交易的理解有了重新认识、需求不断增加,其中最大的共识莫过于,数据并不孤立,大数据的应用价值源于流动和共享。
在此基础上,人们不再像过去那样只纠结于数据所有权的认定,而是对数据权属做出更加细颗粒的界定,如所有权、使用权、价值权、转让权等。相应地,数据交易的定价模式和机制也都基于数据价值展开。
其次是政策顶层设计新方式,2.0版数据交易所迎来了前所未有的政策利好。在此次《要素市场化配置综合改革试点总体方案》前,已有不少重要政策或文件直接鼓励发展数据交易。
2020年4月《关于构建更加完善的要素市场化配置体制机制的意见》中提及的“引导培育大数据交易市场,依法合规开展数据交易”成为标志性的顶层设计。
进入2021年,《建设高标准市场体系行动方案》、《“十四五”规划和2035年远景目标纲要》以及《数据安全法》都明确鼓励数据交易并探索建立相关具体机制。
在地方层面,《深圳经济特区数据条例》、《上海市数据条例》开创先河,并将于2022年开始实施。这两份地方政策对数据交易做出了更加详细的规定,如数据的安全可控和可溯源。
最后是协同化技术共促,2.0版数据交易所迎来了技术迭代,通过隐私计算等前沿科技为数据安全、隐私保护,甚至是交易机制都提供了代码级别的底层保障。
三大数据交易新趋势显现
尽管升级到2.0版已成共识,但数据交易所对数据交易模式与技术的探索与创新始终是进行时。据算力智库观察,当下新一轮数据交易模式在机制与技术呈现出几大明显趋势。
趋势一:数据场景化与产品化。
在数据交易中考虑到数据的落地应用场景,而非孤立的数据价值。
比如,北京国际大数据交易所将启动“北京医疗健康数据创新试点应用竞赛”,就是从医疗健康场景出发,一头着力汇集相关数据,另一头向人工智能、医药研发企业开放数据,有的放矢才更有可能促进创新产品的落地。异曲同工的是,上海数据交易所在成立当日就挂牌“数据产品”20个,涉及金融、交通、通信等八大类,以产品思维让数据在不同场景中精准发挥价值。
趋势二:数据合规化。
数据合规的重要性不言而喻,但难度也非同一般。数据交易所要做好数据合规这件事,一方面要在时间维度上把数据交易延伸至数据生命的全周期,另一方面还要在空间维度上纳入各类专业第三方,才能真正管控好数据合规的时时刻刻与方方面面。
正如《数字规则蓝皮报告(2021年)》指出,新一批大数据交易所拓展模式,更多定位于综合性、全生态的数据流通服务平台,交易中介不再局限于交易撮合服务,将积极介入交易流程,包括数据清洗、加工、审计、资质认证、建模等环节。
这些环节分属不同专业领域,数据交易所未必有能力全部做好,引入第三方的专业服务机构就是重要的创新之举。比如,上海数据交易所就在全国首发“数商”体系,涵盖数据交易主体、数据合规咨询、质量评估、资产评估、交付等多领域,把数据交易的参与者从过去仅限于“交易方”,拓展为一个完善的交易生态。
相似地,北京国际大数据交易所成立了全国首个国际数据交易联盟,涵盖各类数据交易参与方,成员包括北京市大数据中心、北京仲裁委员会、北京金融大数据公司等100多家单位。
黄丽华强调了数据服务方的重要性,她表示,在数据资源方和需求方之间应该存在各类服务角色,如数据组织方、风控服务方、算法提供方、数据加工方、融合计算方、算力提供商、质量评估方等。
趋势三:技术驱动。
以隐私计算为代表的技术能力是交易所2.0模式的重要标志。清华x-lab数权经济实验室主任钟宏表示,数据交易所2.0的核心是技术驱动,用区块链等全新技术手段让数据可用不可见、可控可计量的新模式是非常重要的特点。
事实上,这波数据交易所的技术升级恰好踏准了近年来隐私计算技术兴起的节奏,从技术层面实现了数据的“可用不可见”。从多方安全计算、同态加密、差分隐私等确保数据隐私安全,到联邦学习实现人工智能算法模型的联合计算,再到区块链助力数据确权和溯源,技术加持下的数据交易所可谓如虎添翼。
2019年成立的成都市公共数据运营服务平台是全国最早的隐私计算大规模应用平台之一,利用了可信执行环境、联邦学习、多方安全计算等技术,同时还依托国家超算成都中心的超算算力破解隐私计算的执行效率瓶颈,成为超算+隐私计算的创新实践。
据成都市大数据集团总经理顾勤介绍,该平台已对接数据提供单位38个,接入政务类数据464类,上线数据服务产品98个,支持应用场景40余个(基于信息主体授权)。
北京国际大数据交易所甫一成立就强调其技术创新,利用区块链和隐私计算(多方安全计算、联邦学习、TEE)技术,扩大数据流通渠道,为数据供需双方提供可信的数据融合计算环境。平台还提供测试沙盒,实现数据供需各方可在线完成部署模型,开发及测试。
数据交易未来之路
还有三大关键点亟待理清
站在更高层面看,交易所只是数据交易的平台或路径之一,本质上仍是我国数据要素市场应该如何建的问题。《要素市场化配置综合改革试点总体方案》已经给出了顶层设计的框架,而在实操层面,算力智库认为仍有几大关键点值得着力厘清。
关键点一:交易平台职责待明确。数据要素市场中,数据交易平台仍是关键数据交易主体,从早年仅有的撮合交易功能,到今天关注数据治理全周期并纳入各类第三方,专业度和复杂度陡增,如何让交易平台的角色既不单一,又避免千头万绪,就有必要界定其核心职责。
世界经济论坛在《为数据市场开发负责任的、设计精良的治理结构》报告中指出,需要为数据市场参与者开发一种治理结构,既建立信任又提供激励。在此结构中,数据交易市场的运营者和负责人就应成为信任与激励的来源,其主要角色和职责大致包括五个方面:
一是提供结算,即为买卖双方提供便捷、安全的结算功能,并且尽可能降低交易费用。二是选择市场参与者,遵照具体的资质要求审查买卖双方。三是确保数据质量,基于统一格式和评估标准确保数据质量。四是合理披露,参考证券交易所模式披露交易价格和其他相关信息,五是提供争议解决机制,并有权制裁违规参与者。
关键点二:数据质量待提高。无论从时间还是空间来看,数据质量都是数据要素流通的一道难题,这里的质量既是指数据本身的质量,也包括数据的合法合规性,也就是流通的数据必须“身世清白”。
国家信息中心大数据发展部规划与应用处处长王建冬认为,数据质量是首要问题,其次是数据来源合法性问题。他建议数据交易所的数据必须是一手数据,需要有原始“出生证明”。
华东政法大学教授高富平也认为,建立数据要素市场十分复杂,应先做好数据治理再做市场,其中包括数据的描述与界定等,有了合格的数据要素后才能有市场。
当然,数据的“出生证明”和“身世清白”又会进一步牵涉到复杂的机制与技术问题,还有待学界与业界的进一步研究。
关键点三:基础设施层级有待探索。
经历两波数据交易所热潮后,数据要素市场中的交易主体数量可谓丰富。而在技术层面,各类隐私计算平台林立,也处于各自为政的状态。长远来看,各类平台如何分工协作,避免同质化竞争,将是值得探索的新方向。
王建冬认为应建立国家层面的底层公共基础设施,或称“数联网的根服务”,来解决数据资源的登记、确权、溯源、审计等问题,最终在万物互联互通的世界中实现数据的互联互通。
浙江大学计算机学院教授、博导,浙江大学人工智能研究所副所长郑小林则对算力智库表示,国家层面建立中心化的数据交易平台无法覆盖所有场景。对于国家或政府管控的数据可以建设顶层的单一中心的数据共享平台,但对于更加市场化的数据就没有必要这么做。
他认为,国家单一中心与市场层面的多中心并不矛盾,核心就在数据的分级分类管理,针对不同的行业,不同的数据类别,不同的安全等级,提供不同的数据流通服务机制。
在《要素市场化配置综合改革试点总体方案》出台前业界专家已经形成的共识是,培育和发展中国的数据要素市场应从基础做起,小步快跑。伴随方案落地,奔向2025年的步伐相信会更加稳健。