移动互联网

数字化时代,用“隐私计算”安全开采“数据石油”

2021/9/29 20:44:00


所有身处大数据时代的人们,都在亲历浪潮三部曲,从盼潮的雀跃,到观潮的震撼,再到人在浪潮中的切实体验。

 
热搜新闻中,一则男子“戴头盔看房”的新闻,最能体现大数据时代的拷问:男子头盔遮面,只为躲避售楼处人脸识别系统。
 
售楼处安装人脸识别,是为了区别中介客户与个体客户,更精准获取数据。而消费者头盔防备,是防止信息流入黑市,最终困扰生活。
 
这其实代表大数据时代的矛盾:无所不在的采集对应岌岌可危的隐私,数据流转的渴望对应安全防护的渴求,数据需要流转,但安全是前提。
 
这种矛盾在暗网上体现得更分明。媒体报道显示,去年暗网非法出售数据超万次,交易金额超10亿元人民币。数据甚至包括了银行、证券等金融机构的客户信息,各大电信运营商的机主以及互联网、快递、酒店、医院等各行各业的用户信息,数据已成最畅销商品。
 
与暗网非法数据交易火爆形成对照的是,正规数据交易渠道的冷清。国内最早成立的贵阳大数据交易所,门庭冷落,自2018年最后一次公布交易额后,便再无数据公开。而据《证券时报》报道,其业务已经陷入停滞状态。
 
正规交易冷清,非法交易盛行,这是当下时代特有的冰火两重天,也是向所有从业者提出的时代拷问:如何既让数据创造价值,同时又保护好数据隐私?
 
这是一道需综合数学、密码学、计算机科学等知识来解答的应用题,目前它的最优解,名为隐私计算。
 
它做你的知己,而又对你一无所知。


 

01


最适合时代的门派



隐私计算并不是新概念,它的思源可以追溯到四十年前。

 

八十年代,姚期智院士曾在论文中提出著名“百万富翁问题”:

 

两个百万富翁,想比较一下谁的钱更多,但是每个人都不想公开自己的财富值,有什么方法?


姚期智凭借这一论文开创了多方安全计算领域,多方安全计算也成为隐私计算的基石之一。

 

所谓隐私计算,本质上是在保护数据隐私的前提下,通过一系列技术方式,解决数据流通、数据应用等问题。

 

简单来说,就是用技术手段实现数据的“可用不可见”。以药品为例,患者知道它可以治病,但可能并不清楚药品的每一剂原料。

 

隐私计算就是那个药片,发挥价值,但又不泄露其中的隐私。


从80年代至今,隐私计算逐步发展成熟,目前隐私计算主要分为三个流派,多方安全计算(MPC)、联邦学习(FL)、可信计算环境(TEE)

 

业内人士曾以江湖门派举例:多方安全计算(MPC)是少林派,历史悠久,功力深厚,最早可以追溯到上世纪80年代。

 

联邦学习(FL)是武当派,是后起之秀,像张三丰师出少林一样,联邦学习结合了多方安全计算部分特点,实现了多方协作的机器学习。

 

可信计算环境(TEE)则是华山派,不用苦修密码学内容,硬件在手,横行江湖。

 

当然三大门派,有优势,也有罩门,同盾科技人工智能研究院院长李晓林教授称,“多方安全计算和可信计算环境,并不特别适合目前AI场景需求。”

 

他认为,武当派联邦学习,因为综合了多个流派特点,天然适合分布式学习,优势较大。

 

李晓林所在的同盾科技,作为国内较早探索隐私计算技术的企业,推出了“知识联邦”框架体系,支持多方安全检索、多方安全计算、多方安全学习(联邦学习)、多方安全推理等技术方案。知识联邦以层次化的方式,将隐私计算的几个主要流派都融合在知识联邦中。

 

现阶段,隐私计算发展已渐入佳境,隐私计算公司数量众多,这同样带来了新的问题。这些公司或平台缺乏统一标准,技术流派也不同,不同平台间的数据也无法跨平台交互,长此以往,“数据孤岛”问题有逐渐演化成“平台孤岛”的趋势。

 

面对这一问题,行业需要尽快制定相关标准,建立隐私计算框架。去年7月,工信部旗下中国信息通信研究院组织编制隐私计算的三项标准,作为国内第一批参与隐私计算标准的企业之一,同盾科技参与了这一标准的制定。

 

9月,《中华人民共和国数据安全法》正式施行,这是中国第一部有关数据的专门法律,标志着中国在数据安全领域有法可依,也成为隐私计算行业标准化进一步发展的契机。

 


02


隐私计算的尝试



去年10月,美国知名信息机构Gartner发布预测,列举了2021年企业需关注的重要科技趋势,其中隐私计算,首次单独上榜。

 

Gartner表示,隐私计算上榜,是因企业从消费者数据获取收益的争议越来越多。

 

越来越多人意识到个人数据中蕴藏的价值,人们希望控制自己的数据资产,入场者也不断增多。

 

据《科创日报》不完全统计,2020年至今,隐私计算领域已经诞生至少17起融资,其中披露的融资金额都在千万人民币以上,天风证券预计,国内隐私计算市场规模未来有望达到上百亿。

 

尽管资本市场表现出强大热情,但目前隐私计算实际尚未进入全领域商用阶段,大部分隐私计算公司落地的场景都在金融行业。与其他领域相比,金融行业数据较完善、价值高、监管要求严格,对隐私计算的需求更强烈


例如,上海大数据中心的普惠金融、沪惠保等应用,均采用了隐私计算技术来实现公共数据的安全开放,做到数据所有权和使用权分离;此外,中国银联、交通银行、华控清交等联合申报的监管沙盒项目,也是基于多方安全计算的图像隐私保护产品。

 

这些进入运行阶段的项目,通过实际应用证明,隐私计算可以有效提高数据使用效率。以浦发银行与蚂蚁集团合作为例,双方采用多方安全计算的风险模型来使用多个合作方的数据,以此评估客户风险。

 

媒体报道显示,该模型识别出超过14.5万名高风险客户,阻止了数十亿人民币的高风险贷款的发放。这进一步提高了资产质量,减少了损失。

 

中国信通院云计算与大数据研究所所长何宝宏在接受采访时表示:隐私计算行业整体处于规模商用的前期,2019年主要集中于技术科普和市场教育,2020年开始出现较多的产品进入概念验证阶段(POC),直到近期开始出现规模化的招标与应用。

 

这一过程正在逐渐加速。2021年,同盾和一家国有大型银行合作,针对企业级数据分级分类、敏感信息保护等行业及监管关注的焦点,在数据安全管理的基础上,基于同盾的智邦平台实施集团跨法人的数据应用场景落地,将数据治理和数据价值实现有效结合。

 

据了解,同盾科技是第一家将知识联邦技术应用于国有大型银行的科技企业。

 

业内人士称,对企业来说,数据资产只有流转起来才能发挥最大价值,而隐私计算应用潜力巨大。金融、保险、医疗、物流、汽车业等众多拥有敏感隐私数据的领域都是隐私计算的潜在客户。这也是为何越来越多企业押注隐私计算的原因。

 

金融行业只是开始,当隐私计算走向成熟,数据的价值被充分发掘,可以预知,行业的变革才刚刚开始。



03


最宝贵的流转



2017年《经济学人》封面文章指出,如今全球最宝贵的资源,不再是石油,而是数据。

 

此后,石油成为数据价值的常用比喻。2020年,中国官方更是将数据作为生产要素写入文件,与土地、劳动、资本、技术并列。

 

回顾人类千年历史,每个时代都有决定性资源。煤炭是第一次工业革命催化剂,石油是第二次工业革命动力源,如今,数据或将主导新一轮工业革命

 

但找到资源,并不意味着革命完成。1612年,英国人发明了焦炭,煤炭才被应用于冶炼铁矿,而直到瓦特改良蒸汽机,煤炭才成动力源。

 

与之类似,石油已发现千年,但直到内燃机诞生后,石油才真正驱动世界。

 

数据与煤炭和石油同理,作为一种资源,仅仅发现是不够的,还要有相应的开发、应用、流转等配套生态。


作为隐私计算技术支持者,同盾科技摒弃门户之见,构建了强兼容性的生态。同盾以知识联邦理论框架为基础,推出数据安全交换协议(FLEX),为联邦算法提供多方数据安全交换的应用支撑。

 

同时,为了更好服务开发者、服务商和客户,更全面支持互联互通,同盾进一步提出了“InceptionAI天启可信AI开放操作系统”,在系统中,同盾提供数据商店、模型商店和应用商店等开放市场,和淘宝类似,数据应用可以像商品一般安全流动。

 

此外,同盾科技还联合浙江大学、中科院医学所、360集团等众多学界、业界单位成立知识联邦产学研联盟,推动隐私计算生态的发展。

 

李晓林教授认为,隐私计算需要解决的问题远比“门派之争”复杂,单一技术路径无法解决所有问题,不同技术路径的互补融合才是发展趋势。

 

英国经济学家,1991年诺贝尔经济学奖获奖者罗纳德·科斯说过:“如果你拷问数据足够久,真相自然就会浮现出来。”

 

这句话更适用当下的时代,万事万物都有数据的经纬,只是我们更需要的不是拷问,而是安全的流转。而隐私计算,就是流转的答案。


版权声明
本文仅代表作者观点,不代表艾瑞立场。本文系作者授权艾瑞专栏发表,未经许可,不得转载。
  • 合作伙伴

  • 官方微信
    官方微信

    新浪微博
    邮件订阅
    第一时间获取最新行业数据、研究成果、产业报告、活动峰会等信息。
     关于艾瑞| 业务体系| 加入艾瑞| 服务声明| 信息反馈| 联系我们| 合作伙伴| 友情链接

Copyright© 沪公网安备 31010402000581号沪ICP备15021772号-10

扫一扫,或长按识别二维码

关注艾瑞网官方微信公众号