春节特辑 | 隐私计算在金融领域应用发展报告2021

零壹财经
关注

(三)法律政策的推动:隐私计算成为持续的刚需

在市场需求产生,技术基本达到可用的情况下,法律和政策环境也在朝着保护个人隐私的方向推进。

近年来,通过立法加强数字经济下的数字安全及个人信息保护已经成为世界性的趋势。同时,数字经济下数据的战略地位凸显,相关支持政策频出。

1、立法进展

1.1 欧盟GDPR生效

欧洲议会于2016年4月通过的《欧盟一般数据保护条例》(General Data Protection Regulation,GDPR),于2018年5月25日在欧盟的28个成员国生效。该条例适用于所有欧盟成员国的个人信息保护,任何收集、传输、保留或处理涉及到欧盟成员国内的个人信息的机构组织均受该条例的约束。

GDPR被认为是史上最严的数据保护法规,促进了全球更为严格的个人信息保护趋势。由于其约束力超越了欧盟这一地理范围,覆盖到在欧盟有相关业务的国际机构组织,GDPR实际上重构了国际个人信息保护标准。咨询公司埃森哲在一份报告中认为GDPR是“近二十年来数据隐私规则领域发生的最重要变化”。

GDPR强调责任共担,数据供应链上的各方都要承担责任,改变了过去由收集和使用数据的数据拥有者负责保护数据的规则,要求数据处理者也要承担合规风险和义务。GDPR对于违规的处罚极为严厉,处罚金额高达2000万欧元或企业全球年营业额的4%(二者取较高值)。2021年7月,亚马逊因为对个人数据的处理不符合GDRP被欧盟开出了7.46亿欧元(约合8.88亿美元)的巨额罚单。

1.2 美国CCPA实施

2018年6月28日,《加利福尼亚州消费者隐私保护法案》(CCPA)经州长签署公布,并于2020年1月1日起正式实施。

CCPA从消费者保护的角度,规定了个人信息处理者的义务,包括“必须披露收集的信息、商业目的以及共享这些信息的所有第三方;企业需依据消费者提出的正式要求删除相关信息”,等等。在处罚方面,CCPA规定违法企业面临支付给每位消费者最高750美元的赔偿金,以及最高7500美元的政府罚款。

加州的硅谷是互联网企业的集聚地,包括世界上著名的行业巨头如微软、谷歌及亚马逊等,所以CCPA的影响会通过这些互联网企业向外辐射;另一方面,CCPA的约束范围覆盖了处理加州居民个人数据的营利性实体,从这个角度,与GDPR一样,给相关跨国企业带来影响。

1.3 中国国内法律框架体系成形

关于个人信息保护及数据安全的立法及监管,与欧美等西方国家相比,中国国内相对滞后。但随着近年来侵犯个人信息的现象频发,甚至出现了非法获取,泄露、滥用,倒卖个人信息的“黑产”,侵犯个人信息与网络诈骗及敲诈勒索等犯罪行为合流,国内的相关立法及监管也逐步完善,监管趋于严格。

在数据安全及个人信息保护方面,中国目前已经形成了包括民法、刑法及单行法在内的法律框架体系。
刑法具有最高的保护和约束效力,2017年6月,《最高人民法院、最高人民检察院关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》开始施行,明确了侵犯公民个人信息罪的定罪量刑标。

2021年7月,最高人民法院发布的《最高人民法院关于审理使用人脸识别技术处理个人信息相关民事案件适用法律若干问题的规定》,明确了人脸识别技术应用的法律边界。

2020年5月通过的《中华人民共和国民法典》中将人格权单独成编,对个人信息受法律保护的权利内容及其行使等作了原则规定。
在单行法方面,2017年6月,《网络安全法》开始施行。2021年,《数据安全法》及《个人信息保护法》通过,并分别于9月及11月开始施行。

表:数据安全及个人信息保护方面的法律及相关解释(按时间顺序)

数据来源:零壹智库整理

《数据安全法》及《个人信息保护法》的通过与实施是2021年以来数据领域法制建设的重大进展。

这两部法律的实施标志着数据安全及个人信息保护的法制治理进入系统化和专门化的新阶段,将进一步提升整个社会的守法意识,也将促进数据相关企业严守业务边界,合法合规经营;而法制环境的完善,也将促进整个数据产业的健康发展,为隐私计算行业的发展带来契机。

2、政策推动

在法律不断完善的同时,政策也成为隐私计算市场发展的助推器。

未来,数据将成为新的生产要素,释放数据红利对未来推动数字经济高质量发展至关重要。

2019年,新型冠状病毒疫情过后,全社会都更加认识到数字化发展的重要性。2020年开年之后出台的一系列政策,都对隐私计算市场的发展形成有力推动。

表:数据相关政策文件(按时间顺序)

数据来源:零壹智库

根据零壹智库调研了解,政策的出台对市场的影响是巨大的。比如隐私计算厂商在拓展政务市场时,能明显感受到,政策出台后地方政府相关部门对隐私计算技术的尝试更加积极。

法律和政策环境的变化,一方面使得对个人隐私的保护成为持续稳定的市场需求,而非短暂的应对监管的行动;另一方面使得对数据价值的充分应用和挖掘的行为受到正面肯定。客观上,数据价值挖掘和个人隐私保护成为必须并行兼顾的社会目标,这使得隐私计算成为现实中的刚需。

隐私计算对数字经济的影响趋势

作为当下实现数据“可用不可见”的唯一技术解,隐私计算将对未来的科技产业以及实体经济的关键领域产生重要影响。

在科技产业,隐私计算对人工智能、区块链、大数据技术的发展都将产生巨大的影响,并且隐私计算对这三个领域的影响是相互关联的。

在实体经济的金融、医疗、政务、零售乃至更多的领域,隐私计算的应用将为产业发展带来新的跃迁。目前,我们了解到的隐私计算在金融、医疗、政务领域的应用是最多的。

(一)隐私计算对科技产业的影响

1、对大数据产业的影响

隐私计算将重塑大数据产业。

首先,隐私计算技术是大数据行业处理数据合法化的刚需。《数据安全法》强调,产业需要平衡数据安全与应用发展。隐私计算将成为平衡的关键技术支点。隐私计算致力于为数据获取、共享、利用提供全周期的安全保障,搭建各类数据的隐私协作基础,降低了数据泄露的风险、杜绝了明文数据留痕造成的价值递减风险。

第二,随着数据流通的安全化,以往较为敏感的数据领域逐渐开放。以政务数据为例,隐私计算使联合政务、企业、银行等多方数据建模和分析成为可能,进一步释放数据应用价值,创造了多样化的应用机遇。

2、对区块链产业的影响[ 该部分主要观点源自零壹财经调研信息,部分表述参考了钛媒体报道《翼帆数字科技创始人夏平:区块链最大应用前景是数据的流通与融合》]

根据零壹财经的调研信息,综合来看,隐私计算与区块链相结合,可以建立更大范围的数据协同网络。在未来,这可能形成数据流通的基础设施。

区块链技术可以用于解决数据资产的流转问题。区块链技术起源于密码学的小圈子,区块链最初提出的目的,是针对密码学的这个圈子里面提出的一个具体问题的解决方案——如何实现安全、可靠、无可辩驳的把一笔资产从A转给其完全陌生的B。比特币的诞生,就是为了解决这个问题。

但是,只应用区块链技术,又不能完全解决这个问题。数据的流通和传统资产的流通,有一个关键的不同,那就是数据的流通需要解决数据的安全和隐私保护问题。如果这个问题不解决,数据就流通不起来。

数据本身的加密和安全问题,隐私计算技术可以解决。

因此,对于数据资产的流转来讲,没有隐私计算,不能解决数据本身的安全和隐私保护问题;没有区块链,不能解决数据的确权问题以及在更大范围内的数据网络协作问题。区块链和隐私计算二者结合,是目前能够看到的建设大规模数据流通网络的途径之一。

3、对人工智能产业的影响

隐私计算与人工智能的结合,未来可以使得人工智能突破数据瓶颈,开启新一轮增长。

近几年来,由于缺乏可用的数据,人工智能的发展遭遇瓶颈。

一方面,政府和个人对于数据隐私保护的需求日渐增强。随着数据价值的凸显,以及信息泄露丑闻的频发,公众明显感觉隐私泄露的弊端远超过AI本身带来的便利和智能。

另一方面,企业将数据要素作为核心资产,不愿意在公开透明的环境下共享流通。因此,人工智能企业缺少可用数据优化模型,阻碍了模型精度的进一步提升。

隐私计算技术成为破局之道,可以为AI模型提供多样化的数据资源。

(二)隐私计算对其他产业的影响

对于那些产生大量数据,而又迫切需要数据交换与融合应用的领域,包括金融、医疗及政务等领域,隐私计算技术将带来深入影响。

1、对金融行业的影响

在金融领域,目前隐私计算主要应用于风控和营销两个方面。

在金融机构金融信贷业务的风控环节,隐私计算可以帮助金融机构将自身和外部数据联合起来进行分析,从而有效识别信用等级、降低多头信贷、欺诈等风险,也有助于信贷及保险等金融产品的精准定价;同样,内外部多方数据的共享融合也有助于提高金融机构的反洗钱甄别能力。

在金融机构的产品营销环节,通过应用隐私计算技术,可以利用更多维度的数据来为客户做更加精准的画像,从而提升精准营销的效果。

但是,隐私计算对金融领域的影响不止于这两个方面。隐私计算与区块链技术结合之后,可以改变更多的金融场景。

比如,在支付场景下,传统的支付过程中,支付的服务方和中间参与者都可以获取交易双方的身份和交易金额,存在严重的信息泄露风险。而通过隐私计算技术,可以将交易双方的敏感信息“隐匿”。这种隐匿支付技术应用在供应链金融领域,能够防止信息泄露带来价值损失,同时保护了各方隐私,有利于打破供应链金融中的信息孤岛和互通困难等问题。在跨境支付领域,隐匿支付能够提高用户对支付行为的信任,有利于降低跨境支付成本,提升支付效率。[ 微众银行《WeDPR方案白皮书》,2020年1月。]

2、对医疗行业的影响

目前隐私计算的商业落地较多地集中在金融行业,而医疗是非常有潜力的一个领域。医疗领域聚集了大量的诊疗数据,而这些数据具有很强的隐私性,是各方实现数据共享的一大障碍。隐私计算的切入对于这些数据的融合应用在分级诊疗、医疗资源共享、医药研究以及辅助诊疗提高准确度等方面发挥作用提供了保障,有助于整体上提高公共卫生服务水平。

3、对政务领域的影响

以往,各政府机构的信息管理系统建立在部门内部,相互之间缺少横向联通,同时出于数据安全及隐私保护,对于数据分享相对谨慎,政务数据的共享及融合应用与数字经济发展的需求之间仍存距离。

隐私计算的切入,能够在保护数据安全和个人隐私的前提下,实现政府不同部门之间的互联互通及数据共享,包括司法数据、社保数据、公积金数据、税务数据、水电燃气数据、交通数据等等,从而促进政府不同部门的协同,提高政府的效率以及决策质量。

同时,隐私计算加持下,政务数据可以向社会开放,为企业或学界所用,释放更多价值;同时,民间的数据源也可向政府开放,提高政府在决策以及政务流程等方面的效率。

隐私计算的技术路径

本章将简明扼要地为大家梳理隐私计算的概念、主要技术流派和应用标准,以使得大家对隐私计算技术本身有更清晰的认识。

(一)隐私计算的定义

隐私计算是“隐私保护计算”(privacy-preserving computation)的中文简称,根据“大数据联合国全球工作组”(Bigdata UN Global Working Group)的定义,这是一类技术方案,在处理和分析计算数据的过程中能保持数据不透明、不泄露、无法被计算方以及其他非授权方获取。

大数据联合国全球工作组成立于2014年,由31个成员国和16个国际组织组成。早在2018年,工作组就致力于促进各国多个统计局相互进行敏感大数据协作,是最早研究隐私计算的国际组织之一。2019年,该工作组出台了《联合国隐私保护计算技术手册》,以方便各国统计局以安全适当方式访问新的 (敏感)大数据源。

需要注意的是,隐私计算不是指某一个具体的技术,而是一个范畴和集合。可信执行环境、多方安全计算、联邦学习等都属于隐私计算技术。

(二)隐私计算的技术流派

隐私计算技术是在保护数据本身不对外泄露的前提下,多个参与方通过协同对自有数据处理、联合建模运算、分析输出结果、挖掘数据价值的一类信息技术。  

作为跨学科技术,隐私计算涉及密码学、机器学习、神经网络、信息科学,同时可与人工智能、云计算、区块链分布式网络等前沿技术融合应用,为数据保护和价值融合提供技术可行性。

从技术实现原理来看,隐私计算有两种分类方式。

一种是将隐私计算技术分为两个方向——可信硬件和密码学。可信硬件指可信执行环境(TEE),主要依靠硬件来解决隐私保护问题;密码学以多方计算、联邦学习为代表,主要通过数学方法来解决隐私保护问题。

另一种是将隐私计算分为三个方向。由于联邦学习是密码学、分布式计算、机器学习三个学科交叉的技术,目前更常见的是三分类法,即分为密码学、可信硬件和联邦学习三个流派。以密码学为核心技术的隐私计算以多方安全计算、同态加密为代表;可信硬件以可信执行环境为主导;“联邦学习类”泛指国内外衍生出的联邦计算、共享学习、知识联邦等一系列名词,是指多个参与方联合数据源、共同建模、提升模型性能和输出结果准确性的分布式机器学习。

1、多方安全计算

多方安全计算(Secure  Muti-Party  Computation,MPC)理论,是1982年时任加州大学伯克利分校计算机系教授姚期智为解决一组互不信任的参与方在保护隐私信息以及没有可信第三方的前提下的协同计算问题而提出的理论框架。后经Oded Goldreich、Shafi Goldwasser等学者的众多原始创新工作,多方安全计算逐渐发展为现代密码学的一个重要分支。多方安全计算能够同时确保输入的隐私性和计算的正确性,在没有可信第三方的前提下通过数学理论保证参与计算的各方输入信息不暴露,而且同时能够获得准确的运算结果。

多方安全计算通常借助多种底层密码框架完成,主要包括不经意传输(Oblivious Transfer,OT),混淆电路(Garbled Circuit,GC),秘密共享(Secret Sharing,SS)和同态加密(Homomorphic Encryption HE)等。
不经意传输是指数据传输方发出多条信息,而接收方只获取其中一个。由于传输方不确定最终到达的信息是哪一条,接收方也无法得知未获取的其他信息,从而双方的数据都处于隐私状态。

混淆电路是最接近“百万富翁”解决方式的思路。多方参与者利用计算机编程将输入的计算任务转化为布尔值,对输入的具体数值加密,因此多方在互相不掌握对方私人信息时,可共同完成计算。

秘密共享是对加密信息的随机切分过程,将信息的片段分散至多个参与方保管。因此除非超过一定数量的多方协同合作,否则无法还原完整的数据并进行解密。

由于多方安全计算通常使用前三种框架便能实现,同态加密也被部分人士认作独立于安全多方计算而基于密码学的技术。同态加密指能实现在密文上进行计算后对输出进行解密,得到的结果和直接对明文计算的结果一致。该概念最早在1978年由 Ron Rivest、 Leonard Adleman和 Michael L. Dertouzo提出。按照支持的功能划分,目前大致可以分为全同态加密和部分同态加密。全同态加密可以在加密态密文的状态下对数据进行各种运算,而部分同态加密只能对密文进行无限次同态加法或无限次同态乘法操作。

多方安全计算技术通用性高、准确性高,行业内也肯定了算法的理论价值和应用前景。即使密码和开发的难度导致其性能中等,密码学领域也有一半以上的学者研究多方安全计算的相关话题。作为发展历史最长、相对更成熟的技术,多方安全计算技术成为了各科技大厂和新秀的技术路径之一。

2、可信执行环境(TEE)

可信执行环境作为易开发、高性能的隐私计算技术,与硬件提供方存在强依赖关系。其实践路径表现为:在CPU内划分出独立于操作系统的、可信的、隔离的机密空间。由于数据处理在可信空间内进行,数据的隐私性依赖可信硬件的实现。

3、联邦学习

联邦学习(Federated Learning)从技术层面上涉及隐私保护、机器学习和分布式领域,能有效地满足数据在不出本地的情况下,实现共同建模,提升模型的效果。

根据特征空间和样本ID空间的不同,联邦学习分为横向联邦、纵向联邦和联邦迁移学习。

横向联邦学习适用于特征重合较多、样本重合较少的联合计算场景。但通过构建联邦生态,参与者可以聚合更多的数据样本,从而解决单边建模数据不足的情况。例如,某银行在不同区域设立分行,由于商业模式相同,数据拥有重合度较高的特征,但各行服务不同地区的客户,样本重合较少,这种情况就可以应用横向联邦学习。

纵向联邦学习适用于样本重合较多、特征重合较少的联合计算场景。通过建立联邦生态,参与者可以丰富样本特征,实现更精准的样本描述。例如,服务同一群体的银行与电商平台就可以采用纵向联邦学习。

联邦迁移学习是对横向联邦学习和纵向联邦学习的补充,适用于特征、样本重合均少的场景。例如,不同地区的银行和商场之间,用户空间交叉较少,并且特征空间基本无重叠。

联邦学习在国内隐私计算赛道得到了广泛的应用,如微众银行FATE开源平台,平安科技“蜂巢”、百度开源框架PaddleFL、字节跳动Fedlearner平台。此外,一些隐私计算创业公司也在通过联邦学习技术的探索与应用,积极入局,如星云Clustar。

(三)隐私计算的技术标准[ 这里,阶段的划分参考了富数科技合伙人黄奉孝的文章《说说国内隐私计算行业标准的三个阶段》]

按照标准内容和参与机构,国内的隐私计算标准大致能够分成三个阶段。从理论层面、测评层面到互联互通层面,三个阶段下隐私计算标准的实用性和覆盖范围逐渐提高。隐私计算标准的参与和发布机构由企业和行业机构也逐渐转向国家和国际层面的机构。值得注意的是,隐私计算相关的技术标准仍在制定中。

1、第一阶段

第一个阶段标准在定义和框架上给出了解释,这个阶段更加关注理论,主要满足科研性实验性课题。此外,参与制定标准的机构主要为企业和行业机构。

2、第二阶段

第二阶段的标准在性能和工程化安全方面给出了测评标准,让隐私计算从理论框架层面过渡到支持测评的实践方面,从企业实践方面提升了隐私计算标准的可用性。其中,“可信隐私计算”产品测评体系作为对隐私计算产品的功能和性能进行评测的标准,受到广泛的认可。

3、第三阶段

第三阶段的标准强调互联互通,主要针对隐私保护措施带来的数据孤岛问题。这个阶段还伴随着国际和国家层面机构参与到隐私计算的标准制定。其中,《隐私保护机器学习技术框架》是首次通过隐私计算技术领域的国际标准;《隐私保护的数据互联互通协议规范》是隐私计算互联互通的首个国家标准。

声明: 本文由入驻OFweek维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存