金智塔科技首席科学家郑小林教授:隐私计算是数字经济下数据安全流通的支撑性技术

新闻发布者

金智塔

新闻发布时间

2023-03-08

随着数字经济和信息技术的蓬勃发展,全社会对数据安全的重视程度达到了前所未有的高度。中国信息通信研究院“数据安全共同体计划”发起以来,积极落实国家数据安全产业生态建设工作布局,推动数据安全政策、技术、产品、人才多要素良性互动。值此“数据安全共同体计划”发起一周年之际,由中国信息通信研究院安全研究所主办,大数据应用与安全创新实验室承办的首届“数据安全共同体计划成员大会”于2023年3月在京隆重召开,浙江大学计算机学院教授、金智塔科技创始人兼首席科学家郑小林受邀出席会议并做“隐私计算赋能数据安全合规”主旨演讲。

 

 

郑教授首先分享目前最火人工智能研究案例ChatGPT的交互过程以及AI产业面临的“产权、数据合规、隐私保护、公平公正“四大挑战,抛出在数据过程中如何保护隐私的核心问题。其中数据合规和隐私保护在数据要素流通中成为关键的环节。针对隐私保护技术,郑教授介绍了目前市面上几大安全流派,基于密码学技术有多方安全计算、秘密共享、混淆电路、同态加密等;基于非密码学技术有差分隐私、分布式学习和可信硬件等。这些技术给后续落地应用带来了安全性、高效性和可用性。

 

算法设计安全性的实现基于混合架构的纵向图联邦学习框架,在图神经网络第一层通过秘密分享的方式得到多方融合的节点特征,后续本地各个节点基于自身图数据进行计算,最终服务器汇总多个参与方的节点特征进行模型预测。但其中也不乏面临挑战,在神经网络模型中有大量非线性激活函数的计算;对于非可证安全的算法,对其安全性度量也十分重要。

 

高效性基于秘密分享和随机排列的隐私保护机器学习算法,在隐私泄露极小的情况下高效计算非线性逐元素激活函数,与秘密分享的加法、乘法结合;并通过使用距离相关性指标对隐私保护程度进行量化分析,表明随机排列机制能够有效的控制隐私泄露程度,使得攻击者几乎不可能恢复出原始信息。

 

可用性则基于隐私保护的跨域推荐,是一种不泄露隐私前提下的差分学习方式,郑教授介绍了两种可实现的方案:一、通过基于Johnson- Lindenstrauss变换得到用于公开的差分隐私评分矩阵,通过深度自编码器和深度神经网络建模公开的源域评分矩阵和原始目标域评分矩阵,这样不仅保护了数据隐私还保护了用户之间的相似性;二、通过Rényi差分隐私对抗地建模源域的原始数据分布,可以生成稠密且虚假的评分提供給目标域,通过虚假的源域评分矩阵和真实的目标域评分矩阵构建跨域推荐模型。

 

 

基于隐私保护的跨域推荐框架:方案一

 

金智塔隐私计算技术目前已在多个领域不同场景进行应用,郑教授以三大场景为例进行剖析:政务数据流通、公共数据授权运营、产业数据价值化。其中,公共数据授权运营正加速在各大城市推进,它能促进公共信息的共享和开放,提高公共信息的透明度和可用性,促进数据价值的最大化释放,助力产业数字化转型发展。

 

最后,对隐私计算行业的未来发展,郑教授认为除了基于TEE、FL、MPC、BLOCKCHAIN、软硬一体等技术的全面融合,我们还将借助互联互通、安全评估、性能评测等业内标准建设,最终搭建以技术生态、数据生态、应用生态为一体的全闭环生态体系,以实现隐私计算在各行各业的落地赋能。