业界动态
蚂蚁发起“隐私革命”,数据,应用,技术
2024-07-23 01:60:43
蚂蚁发起“隐私革命”,数据,应用,技术

AI加快了整个行业迈向数据密态时代。

7月5日,在2024年(nian)世界人(ren)工(gong)智能大会上,蚂(ma)蚁集团推出了蚂(ma)蚁密算公司的第一款产品——“隐语Cloud”大模型密算平(ping)台。

据蚂(ma)蚁密算CEO王磊介绍,“隐语Cloud”大模型密算平(ping)台主(zhu)要提供两个能力,分别为大模型密态托(tuo)管和大模型密态推理。

密态托(tuo)管主(zhu)要是解决大模型本(ben)身IP保护的问题(ti),当(dang)大模型在云上部署的时候(hou),大模型会被加工(gong)成密态的,确保模型IP不会被别人(ren)偷去(qu)。大模型密态推理主(zhu)要解决的是访问信息的保护,访问信息在整个的推理过程中都(dou)是密态的。

当(dang)下,高(gao)质量数据供给和安全流通,成为大模型进入垂直产业应用(yong)的首要挑战。大模型在垂直行业应用(yong)时,许多企业通过私有化部署来应对数据安全挑战,这不仅(jin)增加企业的运维和服务成本(ben),也影(ying)响对外服务的效率和质量。

专业数据通常分布在不同机构和企业,因其高(gao)价值和保密性而难以(yi)共享(xiang)。同时,企业、大模型厂商和用(yong)户之间存在信任障碍:企业担心数据泄露,厂商担心模型资产安全,用(yong)户则担心个人(ren)隐私风险。

王磊透露,隐语Cloud平(ping)台将提供全链路(lu)数据安全服务,覆(fu)盖大模型从构建到服务的全过程。平(ping)台将为大模型的预训(xun)练、微调、评测、推理和用(yong)户交互提供密态计(ji)算,确保数据在提供方、使用(yong)方之间的安全流转。此(ci)外,平(ping)台还将提供包括密态检索、提示词和流程编(bian)排(pai)在内(nei)的全链路(lu)开发工(gong)具。

蚂(ma)蚁集团副总裁兼(jian)首席技术安全官、蚂(ma)蚁密算董(dong)事(shi)长韦韬认为,数据供给决定了大模型应用(yong)能力的上限(xian),而隐私计(ji)算技术决定了数据跨域供给的上限(xian)。当(dang)大模型从通用(yong)走向专业应用(yong),从技术想象力走向产业的生产力,必须要解决高(gao)质量数据集稀缺与专业数据阻滞的挑战,否则大模型作为“智力引(yin)擎”,只会陷入空转。

5月底,蚂(ma)蚁集团宣布了以(yi)AI和数据技术为核心的科技战略(lue),并成立了浙江(jiang)蚂(ma)蚁密算科技有限(xian)公司,将提供密算相关的产品和服务,包括一套端到端的数据安全保障、一套软硬件结(jie)合的计(ji)算加速解决方案和一个隐私计(ji)算云服务平(ping)台,推动数据安全可信的跨云跨端低成本(ben)流通。

以(yi)下是华尔街见闻与蚂(ma)蚁集团副总裁兼(jian)首席技术安全官、蚂(ma)蚁密算董(dong)事(shi)长韦韬和蚂(ma)蚁密算CEO王磊的对话实录(经编(bian)辑):

提问:如何看待成本(ben)、安全和性能之间的关系?

王磊:安全一定是有成本(ben)的,这本(ben)质上包含两个方面:首先,从商业视角看,隐私计(ji)算技术带来的安全收(shou)益是否足够抵消成本(ben)。例如,在数据泄露事(shi)件中,我们观察到的损失动辄数百万美元,因此(ci),如果安全措施的成本(ben)低于潜在损失,那么这些措施就是可接受的。其次,从技术角度出发,随着(zhe)技术的不断(duan)迭代,相关成本(ben)将逐步降低。此(ci)外,隐私计(ji)算产品需要根据安全需求进行分级,对于价值不是非常高(gao)的数据,不必采用(yong)高(gao)成本(ben)的安全防(fang)护措施。在对数据进行安全分级的基础上,技术措施也应相应分级。当(dang)数据的价值与其安全措施的成本(ben)相匹配时,这样的安全策略(lue)才是最经济、最合理的。

提问:如何理解在加入密态计(ji)算流程后,服务成本(ben)反而降低的情(qing)况?此(ci)外,加入密态计(ji)算似乎增加了一个步骤,这将如何影(ying)响整个数据流通的效率,是提高(gao)还是降低?

韦韬:单纯看技术链路(lu)肯定是成本(ben)更高(gao),但从整个全链路(lu)来看,综合考虑(lu)人(ren)为因素(su)、技术因素(su)和合规因素(su)等,实际上总成本(ben)是更低的。明(ming)文(wen)计(ji)算虽然在初期(qi)看似简单,但一旦发生数据泄露,将会带来巨(ju)大的损失,包括商业利益的损失和法律风险等。密态计(ji)算的研发将引(yin)发一场变革(ge)。目前,许多数据源方由于担心数据泄露,不敢(gan)轻易共享(xiang)数据。密态计(ji)算技术能够使这些原本(ben)无法流通的数据得以(yi)安全流通,从而充分发挥数据的价值。

提问:随着(zhe)大模型的问世,人(ren)们普遍关注算力速度和价格这两个问题(ti)。近两年(nian),许多独立的隐私计(ji)算厂商发现生意越发难做。在我们的策略(lue)或方法中,当(dang)应用(yong)到具体(ti)的业务场景时,客户通常在哪些方面会采用(yong)密态计(ji)算?

韦韬:在过去(qu)两年(nian)中,隐私计(ji)算行业进行了大量尝试,主(zhu)要处于所谓的"桶装(zhuang)水"阶段,实现了点对点的连(lian)接。PSI(隐私计(ji)算求交)是目前应用(yong)最广泛的技术之一,它允许两个机构在保护各(ge)自用(yong)户隐私的前提下,进行用(yong)户群体(ti)的交集计(ji)算。虽然这种技术在验证单个环(huan)节方面表现良好,但其应用(yong)范围相对有限(xian),尚未实现数据流转的全链路(lu)保护。

在整个研发过程中,数据源方对于数据泄露的担忧仍然很大,这一问题(ti)尚未得到有效解决。当(dang)前的技术应用(yong)在深度和广度上都(dou)还不够。如果将"桶装(zhuang)水"阶段的技术扩展到大规模应用(yong),成本(ben)将会非常高(gao),而且整个流程缺乏一致性的保障,风险也未能得到有效控制。

王磊:隐私计(ji)算商业化之所以(yi)不再那么热门,主(zhu)要有以(yi)下两个原因:首先,隐私计(ji)算技术目前主(zhu)要适用(yong)于小(xiao)规模应用(yong),且成本(ben)高(gao)昂(ang),难以(yi)实现规模化,这导致了成本(ben)难以(yi)降低。只有扩大规模,成本(ben)才有望降低。其次,传统的商业模式主(zhu)要是销售软件,这种高(gao)成本(ben)的交付模式并不利于隐私计(ji)算技术的应用(yong)和推广。隐私计(ji)算的最终目标是促进数据的安全流通。

我们成立新公司后,也在深入思考这个问题(ti)。一方面,我们计(ji)划(hua)采用(yong)云化模式,包括即将推出的隐语Cloud等系列产品。我们认为,只有通过云服务,数据才能真正实现大规模流通,并应用(yong)于更复杂的场景,从而实现规模化并降低成本(ben)。同时,我们也将在端侧推出相关产品,实现端云协同。

另一方面,我们希望建立一种对结(jie)果负责的商业模式。这意味着(zhe)在数据流通的整个过程中,我们能够确保数据安全,从全链路(lu)的角度降低成本(ben)和法律风险。我们希望在这个过程中持续获得收(shou)益,因为数据价值得到了保障,从而从数据价值中获得利润。

我们希望引(yin)入保险公司,它能够起到两个作用(yong):一是作为独立第三方,在事(shi)前对产品安全性进行评估,提供数据安全保险;二是在发生不可预见的黑天鹅事(shi)件时,提供事(shi)后保障。通过这个方式推动整个的产业良性地运作起来。这样的机制将促进整个产业的良性运作。只有商业模式健康运转,技术创新和迭代才能持续健康发展。

提问:在过去(qu)几年(nian)中,市场上普遍认同了隐私计(ji)算技术的重要性,但在技术层(ceng)面,对其是否为一项必不可少的技术存在分歧。一些专家指出,尽管隐私计(ji)算的成本(ben)较(jiao)高(gao),但可能存在性价比更高(gao)的替(ti)代技术。隐私计(ji)算要获得市场机构的广泛认可,是否真的存在迫(po)切的需求?它还需要克服哪些障碍?

韦韬:隐私计(ji)算技术的发展轨迹与光伏产业颇(po)为相似。光伏技术刚推出时成本(ben)高(gao)昂(ang),不可能立即普及到所有行业。然而,随着(zhe)高(gao)需求行业率先采用(yong)并推动规模化生产,成本(ben)逐渐(jian)降低。当(dang)光伏发电成本(ben)降至与煤(mei)电相当(dang)的临界点时,它便(bian)开始得到广泛应用(yong)。

隐私计(ji)算同样遵循这一模式,它将首先在高(gao)价值数据和场景中得到应用(yong)。尽管隐私计(ji)算解决的问题(ti)并非仅(jin)限(xian)于高(gao)价值数据,但当(dang)前数据泄露问题(ti)已经非常严重。许多机构的数据在暗网上被交易,造(zao)成严重后果。然而,这只是冰山一角,国内(nei)黑产的大量数据交易已经不仅(jin)限(xian)于暗网,这是一个非常危险的现象。数据泄露正在大规模发生,对社(she)会造(zao)成巨(ju)大伤害,而传统技术路(lu)径无法有效保障数据安全。

当(dang)高(gao)价值数据和场景的行业首先建立起隐私计(ji)算体(ti)系,并实现规模化以(yi)降低成本(ben)时,它将能够服务于更多行业。我们认为,每个行业场景的临界点是隐私计(ji)算的成本(ben)降至数据流通价值的5%左右,这将实现规模化推广。

王磊:我也补充一下,首先先讲一个概念,虽然我们经常提到密态计(ji)算,但隐私计(ji)算仍然是行业内(nei)的共识。我们之所以(yi)不再频繁提及隐私计(ji)算,并不是为了炒一个新概念。在大家的印象中隐私计(ji)算更多是基于多方安全计(ji)算和联邦安全学习(xi)两方做融合,融合的过程中增加保证参与者之间互相不能够窃取到数据。其实在数据大规模流通过程中,很多应用(yong)场景并不是这个。

举个很现实的例子,现在公共数据开放面临什么风险?数据要放到外网做开放,这里面可能不涉(she)及到数据融合,但有巨(ju)大的风险,这是他们不敢(gan)开放的原因。例如,将政务内(nei)网的数据转移(yi)到外网平(ping)台时,如何确保数据的安全性?即使运维公司是可信的,运维人(ren)员是否也同样可信?他们是否可能通过拆卸硬盘或其他方式轻易地窃取数据?此(ci)外,在数据加工(gong)和使用(yong)过程中,即使是有正常权限(xian)的人(ren)员,也可能存在数据泄露的风险。

所以(yi)有很多的真正有价值的数据是不敢(gan)开放的,一直讲开放,一直很难开放。密态计(ji)算通过密态的方式确保运维者没有办法窃取到数据,让数据真正的开放流通起来。

隐私计(ji)算之前只应用(yong)到整个数据流通当(dang)中的一小(xiao)环(huan)节一小(xiao)部分环(huan)节,当(dang)数据真正大面积流通,我需要做到多方数据融合。我们认为密态计(ji)算是下一代的隐私计(ji)算,希望解决数据更大规模流通中遇到的真正问题(ti)。

发布于:上海市
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7