原创:谭婧

当腾讯推出产品,正式宣布进入隐私计算技术领域,隐私计算创企都证明自己的路走对了,甚至有机会被巨头收购。华控清交、数牍科技、矩阵元、翼方健数、瑞莱科技都是这个领域知名初创企业。

大多数技术初创企业都是从默默无闻开始,很少看到哪个技术领域的创业企业光环亮,且密度高。

就在过去的2020年,隐私技术作为前沿技术领域,其发展特色是,大牛大佬云集,豪华技术团队带路。

比如瑞莱科技有清华大学张钹院士与朱军博士两位首席科学家。华控清交创始人兼首席科学家是MPC 理论的提出者和重要奠基人姚期智院士。翼方健数(BaseBit.ai)有李凯、密码学女神王小云、宋晓东组成公司技术战略委员会。

卧虎藏龙与人才济济,证明了隐私计算技术的关键性。

2021年4月18日,北京国贸。

在 “腾讯大数据高峰论坛”上,腾讯正式发布自研第四代数智融合计算平台“腾讯大数据-天工”,可以支持千亿级规模的海量数据训练,性能参数领先业界5倍,在此基础上,提供3072bit业界最高强度加密和TEE(Trusted Execution Environment),软硬件双保险。

现场得到的消息是:这一金融级安全强度的腾讯隐私计算技术已广泛应用在医疗、金融风控、数字政务等众多领域。

“腾讯大数据-天工”自研隐私计算技术,从大数据分析到机器学习,为多个场景提供全方位保护,去中心化的架构避免单点隐私泄露风险。

笔者理解,隐私计算是数智融合计算平台重要特色,长远目标是毫无感知进入数据生命周期,融入大数据技术和计算平台系统。

这也符合隐私计算基础性极强的特色。

没有好数据,就没有好智能。在安全有保障的前提下,数据的流动性是合理和必要的。

尽管核心技术不可能统一标准比较,但是创业技术公司也各有特色。

创业技术公司的产品路径与腾讯也不可能相同,有的发力隐私计算编译,有的发力模型联邦化,有的侧重同态加密技术,有的使用秘密共享(Secret share)。产品路径方面,有的输出机器学习平台,有的隐私计算可以是所有机器学习平台当中的一个模块。

但是,殊途同归,保障安全。

隐私计算领域的学术研究也较为热门。

中国计算机学会多次组织隐私计算技术研讨会,在国际顶级学术会议上(如NeurIPS, ICML, AAAI, IJCAI等)也多次召开有关隐私计算技术的专题研讨会,与隐私计算相关的学术论文平均每年都超过1000篇。

但是,有时候,学术论文这么说行,但是你落到商业的场景,大家都有顾虑,尤其是金融、医疗、自动驾驶等领域。

前沿技术日拱一卒,隐私计算还是解决特定领域的特定问题,不是包罗万象,能解决所有的问题,有些人为的问题,用技术解决不了。

一个数据从生成,开始它的生命周期,可能会在多个中间点行走,就像许多企业内部存在数据流动的pipeline,在更宏观的层面也存在类似流式计算的flow。

腾讯数据平台部总经理蒋杰表示:“腾讯自身即拥有海量的数据规模,目前腾讯大数据平台日接入消息量超过55万亿,日实时计算量超过65万亿,平台整体算力超过500万核,日分析任务达到1500万,腾讯是日实时计算量最大的公司。第四代数智融合计算平台是腾讯最近两三年的积累。”


腾讯数据平台部副总经理刘煜宏谈道:“腾讯业务量比较大,平台能力就会比较早的去探索,相比有些同行我们可能稍微走得早一点,包括隐私计算这块也是我们2019年就开始,现在落地了电力、电信、银行等行业,但这个确实还在初步的起步的一个阶段。”

公开信息可查,从2019年开始,腾讯大数据在规划第四代计算平台,包括批流融合、数据湖、联邦学习等新型技术,围绕安全、智能、统一等提出了下一代腾讯天工数智融合计算平台。

腾讯大数据平台将会在数据安全、智能化、统一平台三大方向重点发力。据刘煜宏透露,腾讯目前正在研发联合计算平台,实现在保护数据隐私的同时,提供联合数据分析、联合数据建模等能力。

蒋杰还在会上表示:“此次发布的第四代数智融合计算平台,将以安全的方式打通数据孤岛,桥接多方数据,以统一的数据处理引擎更高效地挖掘数据价值。”

腾讯数据平台部AI平台总监陶阳宇在回答《亲爱的数据》采访问题“关于算法模型联邦化的加速方法”中谈道:

“腾讯Angel PowerFL安全联合计算平台拥有全栈的联邦机器学习和深度学习功能,支持多方联邦逻辑回归、XGBoost、PCA、用户自定义神经网络模型,支持多方联邦模型在线serving和模型管理,支持联合数据分析。算法模型联邦化的解决。我们会深入基础算子,在算法磨练之后,慢慢地攒经验,发现共性可以抽象成一些基础算子。有了这一步,思考未来更多的算法是不是可以通过搭积木的方式就可以组合出来。”

值得一提的是,腾讯研究院与腾讯六大部门共同撰写的《腾讯隐私计算白皮书》,从隐私计算发展背景、技术体系、重点应用行业和场景、数据安全合规、未来发展前景等多角度全方位探索隐私计算。

最后,非常明确的一点是,在数智化发展和安全中必须找到平衡点,但是平衡从来都没有容易的事情。(完)

《亲爱的数据》出品

相关文章