观点分享 | 金智塔CTO陈超超博士:隐私保护机器学习,助力安全高效数字化转型

新闻发布者

金智君

新闻发布时间

2022-07-19

2022年7月13日,由中国信息通信研究院、隐私计算联盟联合主办的“2022隐私计算大会”在京召开。浙江大学特聘研究员、金智塔CTO陈超超博士受邀出席并发表主题为“隐私保护机器学习”的演讲,从密码学、算法以及工程实现三个层面出发,结合应用实践案例,深入探讨工业级隐私保护机器学习技术方向。

 

 

 

--以下为大会演讲实录--

 

 

2021年以来,我国陆续出台《数据安全法》和《个人信息保护法》,正式要求确立数据分级分类管理、落实数据安全保护责任、支持促进数据安全与发展措施。并要求对个人信息的采集、加工、使用权流程做责任落实的要求。

 

 

法律法规、数据安全和信任问题严重阻碍了机构间的数据流通,形成了各个“数据孤岛”,限制了诸多有价值的数据合作。怎么样进行数据合规流通和交易呢?陈超超认为,隐私计算技术成为打破数据壁垒,促进数据要素安全合规流通的最优技术解;并详细介绍了单方数据对外赋能、多方数据联合计算、数据代理计算模式以及数据和模型分离四种常见隐私计算应用模式。

 

 

陈超超指出,机器学习视角涉及到的隐私主要是三部分:数据隐私、模型隐私和参数隐私。模型是从数据中出来的一种模式,模型学习过程中需要频繁与数据进行交互,如果这个过程中模型暴露了,也可能反推出部分隐私数据。此外,参数能够让模型发挥最大功效,因此也需要保密。

 

 

上述的隐私保护问题有哪些技术路线来解决呢?陈超超介绍了主要的四类隐私计算技术:第一类,密码学技术,比如多方安全计算、同态加密,以及特定协议和基础协议。第二类是匿名化技术,包括经典的K匿名和差分隐私技术。第三类是分布式学习技术,主要是联邦学习以及拆分学习。第四类,可信硬件技术,比如可性执行环境。每种技术路线各有优劣,主要表现是他们在安全性、时效性、可用性三方面不太一样。在实际业务场景中,需要融合不同技术路线,以提高安全、效率、易用三方面的平衡点。

 

 

陈超超认为在实践中需要从密码学、机器学习算法和工程实现三个方面对隐私保护机器学习算法进行全面优化,并以案例形式做了详细讲解。

 

 

首先介绍了密码学角度优化的案例。安全矩阵乘法是机器学习常见算法,如果使用经典秘密分享技术做乘法会有两个问题:第一个问题,它依赖大量的乘法三元组,triple生成需要可信第三方或者采用非常耗时的密码学方法生成,都不太理想。第二个问题,秘密分享天然不能处理稀疏数据。针对上述问题,陈超超认为业内有两种常见的优化方法。其一,采用隐匿查询的思路,从大矩阵中筛选出需要做乘法的元素,以减少triple的使用量;其二,将秘密分享跟同态加密结合,基于密文进行计算,整个过程不需要生成triple。这一做法的核心思想是用计算换取通信,从而取得优化效果。这是因为实际场景中计算往往并不是瓶颈,但不同机构间的通信通常才是瓶颈。

 

 

其次,介绍了机器学习算法视角的优化。以神经网络为例,该算法有两个主要特点:一是逐层执行,二是里面包含了大量的非线性计算。如果使用MPC技术,将会非常耗时;若采用拆分学习技术,虽然效率高,但安全性和精确性都会降低。陈超超建议:融合MPC和拆分学习技术,敏感数据相关计算采用MPC技术来执行;而其余的大量的复杂非线性计算由服务器来执行,并运用对抗学习、差分隐私、贝叶斯学习、随机置换等技术加固算法的安全性,以取得安全性、效率、精确性的平衡。

 

 

接着,介绍了工程实现视角的优化。传统隐私计算,每个数据源都会部署计算节点,节点之间通过网络进行加密交互,最终完成协同计算。在整个过程中,隐私计算运行效率主要受数据量、算力和网络三方面影响。在实际场景中,不同机构在这三方面的情况是不一样的,也就是说不同计算节点之间是异构的,这个过程该怎么优化呢?

 

 

针对异构网络,陈超超指出,金智塔科技从实践案例出发,提出了一种新型的调度优化算法。首先收集每个节点的能力,包括其数据、算力和通信能力;然后把收集到的节点能力以及初始的任务调度给到一个节点协同计算优化器,该优化器会针对不同节点的能力以及初始调度任务,找到一个最优的任务调度状态,然后把这个最优任务调度下发给各个子节点,进而实现效率最大化。

 

 

在大会上,陈超超介绍了国家重点研发计划项目“大数据征信及智能评估技术”落地应用成果—金智塔隐私计算平台。该平台融合了多方安全计算和联邦学习技术,完成了数据质量审查、数据分级分类、基于多方安全计算和安全联邦学习的隐私计算等一系列原创研发,并在数字政府、智慧金融、智慧产业等场景开展应用示范。

 

在智慧金融领域,基于金智塔隐私计算所展开的联合智能授信、联合智能营销等方案已推广到10余家农商行、城商行和股份制银行,取得了良好的社会效益和经济效益。在数字政府领域,金智塔通过与省市数源部门和业务管理部门合作,以双碳、亩均论英雄、共富指数等业务场景为切入点,在政务部门内部数据共享、数据校验等方面提供隐私保护技术支持,同时为政务数据的社会开放提供解决方案,助力数字政府建设。在智慧产业领域,金智塔隐私计算平台依托其技术优势,积极赋能传统产业转型升级,近年来在零售企业智慧选址、销售预测、智能营销推荐等领域积累丰富经验,尤其是解决了智能营销场景下的隐私保护难题,助力企业数据资产建设,赋能企业数字化转型。