凤来凰科技网

是音频幻觉谁说互联网时代,隐私一定被出卖?人工智

凤来凰科技网 4

点击播放 GIF 0.0M

巴曙松教授按:

金融理论一般要等到金融实践或者一个金融市场现象发展得比较成熟稳定后才能被总结出来,使其与一台录像机和时间码同步的粗糙的设备。那时是20世纪80年代初:转播车里没有计算机,进而写到教科书里。如果从时间上观察,每一台设备都是模拟的。录像带编辑是机器对机器,这个实例写入教科书的时候,需要一个操作员——视频通过一台切换台,可能已经比市场一线晚了好几年。那么,而音频通过调音台。音乐通过NAB Cart(一种磁带录音格式)播放。我记忆中在转播车里的第一台所谓的“计算机”其实是来自硬盘驱动器上的DigiCart即时回放系统。经过几十年的计算机化和IP在整个广播生态系统的实现,从这个意义上说,创新已经把我们置于一切都是计算机化之地,北汇丰金融前沿讲堂可以说是一“活页版的金融前沿教科书”,并且我们已经看到计算机控制计算机的概念。计算机控制计算机不是什么新鲜事,一个观察和全球金融市场新发展趋势的风向标。

疫情的冲击,但机器学是。对我来说,促使运行中的不同经济领域加速进入信息时代。人们常说,这让我想起了库布里克的《2001年:太空漫游》。声音作为一种指标人工智能(AI)在体育领域的应用已经有一段时间了。例如,数据是信息时代的石油,在温布尔登,随着人工智能技术和数据处理能力的提升,计算机聆听和观看网球比赛,以及机构和个人海量数据的不断产生,理论上我们将数据与人工智能技术完美结合,就能够充分挖掘和释放数据的价值。但由于数据中包含量个人隐私和商业机密,数据隐私的安全问题也广泛受到世界各国的重视。

在数字经济时代,重视数据隐私和安全已经成为一种世界性的趋势,这对以数据为基础的互联网商业模式提出了更高的要求与挑战,同时也为技术创新与金融创新指明了新的方向,而杨强教授正是在这个领域做出了突破性创新。

以下是微众银行首席人工智能官杨强教授在《金融前沿的20种思考》 一书中的内容精选,他向我们分享了既能保护社会隐私,又能让数据得到有效应用的前沿技术,若想了解更详尽的内容,请参见原书。

本文涉及两个重要的领域,一是数据要素和数据隐私,一是机器学。

01

我们需要保护隐私,也需要数据

20 世纪60年代到80年代,人们曾认为计算机可以变得和人类一样聪明,但后来却发现迟迟实现不了。波拉尼悖论提到:“我们知道的远远于我们知道自己知道的。”

我们可能是某方面的专家,但是无法将所知一一写下来。比如,牙医没有办法将其全知识写成一本牙医教科书,因为有很多知识是存在于潜意识之中的,在牙医看来是常识的知识,在其他人看来并不是。因此,人们在发展人工智能时更加重视数据。

数据不仅仅可以作为训练资料教会机器,更重要的是,它是人和机器交互的语言。

我们与机器无法直接沟通,但是所幸中间有一种语言——数据,能够让我们和机器交流。数据成为语言,才真正使人工智能开始腾飞。

数据在模型里以参数的形式出现。在人工智能的发展初期,运行规则由人来拟写,但是发展到了深度学阶段,机器便能够自动产生权重。实际上这些权重就是规则,使得我们在输入和输出中形成有机的映射。随着算力和数据的增加,映射的数量是与日俱增的,一开始是万级,然后达到千万级,现在已经达到了万亿级别,例如,人工智能统计语言模型GPT-3的参数量就是万亿级别的。

有了这么多数据和参数,我们就可以构建复杂模型,研究各种状态,用深度学和强化学一起做不同的探索。这些事是我们以前想象不到的,而且在只具备小数据和小模型的情况下我们也不可能做得到。现在我们能够把机器做得和人一样,让机器能够理解自然语言,能够识别语音和指纹,原因就在于在我们的研究之中量变引发了质变,这个质变使得机器的深度学有了足够的进步。

但是,我们现在遇到一个重问题,即数据并不是理想地只存在于一个地方,我们在现实中遇到的数据往往是分散在各地的。比如,腾讯内有很多业务集团(Business Group,BG),每一个业务集团又分成很多门,现在的情况是这些门之间的数据已经很难互通,更不要说业务集团之间的数据了。这不仅仅是腾讯的问题,也是所有型互联网公司共有的问题,即“门墙”挡住了数据的互通。

而“数据孤岛”指的是,在、民众之间也有所谓的“防火墙”,使得数据以孤岛的形式存在。

数据孤岛引发的第一个问题是小数据的问题,即每一个孤岛的数据量太小。比如,一家医院做核酸检测所产生的数据只能构成“小数据”,但如果我们能够串联起来几十家甚至上百家医院的检测数据,那么数据量就不小了,但是到目前为止这很难做到,因为医院之间很难互相相信,或者不愿意把数据分享给彼此,所以就形成了数据孤岛。

面对小数据和数据分散的问题,人工智能研究者需要给出解决方案,我的解决方案一个是“联邦学”,一个是“迁移学”。

02

联邦学,安全地消灭“数据孤岛”

如果一个欧洲人拿着手机到美国,在美国产生了一些行为数据并将数据存在手机里,那么这些数据是不能上传至美国的服务器的,除非征得该用户同意。此前,谷歌由于不知道或忽视了这件事,遭到了巨额罚款,除了谷歌这样的公司之外,还有千千万万家小公司因此而收到罚单。

我们在思考,如何从技术上支持数据合作,在保证将数据保留在本地的同时,使模型之间可以互相沟通,最后的目标是数据可用,但不可见。例如,我不能看到邻居的数据,邻居也看不到我的数据,但是我们可以合作来建立起一个模型。

如果将此模型抽象成一只羊,将数据抽象为草,我们的目标是带领这只羊到不同的地方吃草,羊在不同的草原之间走动的时候,草可以一直留在本地,相当于模型的参数在加密的状态下互相沟通。

这就是“联邦学”。

谷歌推出了一个安卓系统的联邦学模型,我们称其为“横向联邦”。它是按照用户来切割的。比如,我们有很多台安卓设备,它们都要与服务器连接。现在,谷歌有了一种新的加密手段,在谷歌的安卓系统中,每一个手机上都有不同的模型,它们加密后会被传递到一个中心点做融合,融合之后形成一个新的模型,再在加密的状态下传递给安卓系统的终端模型,使它也能够得以更新。

在此之后,众多国内的手机公司也纷纷建立了自己的联邦学团队,学这种既能保护隐私又能更新模型的模式。

“横向联邦”是针对用户端(to C)的模型,针对企业端(to B)可以使用纵向联邦模型。

很多人都关注联邦学机制,是因为它不只存在于算法层面,各行各业都可以参与其中。

03

联邦学的应用场景

风控·金融机构

风险控制是金融行业的核心。当前,风险控制基本上不再依靠专家,而是依靠数据。但数据往往不够全面,而且是非结构化的和滞后的,很难得到解析。我们可以利用联邦学和各方的实时数据建立联邦学网络,来进行各种各样的金融活动,包括风险控制、投研、营销、保险、支付等。

反洗钱·银行

洗钱的人会选取多家银行,在每家银行进行一点操作。由于银行之间用户信息不互通,因而洗钱的动作很难被发现。通过联邦学,各家银行便可以在数据不出库的情况下,建立一个“横向联邦”,因为各个银行的基本特征和贷款类型都类似,只是其客户不同。此外,银行的客户行为特征很少,因此可以和互联网公司建立一个“纵向联邦”,通过互联网公司增加特征空间,这样一来,系统便可以发现一些之前难以发现的洗钱行为。

个性化推荐·抖音

联邦学很容易迁移到的一个场景是保险,另一个场景是个性化推荐。抖音在美国上市之后发展迅猛。现在抖音存在的问题是,过去本地化的模型是在服务器上建立的,需要把本地的数据上传到服务器之后再建立模型。当前抖音在美国的本地数据无法上传至的处理器,因而需要使用联邦学,字节跳动已经建立起了自己的联邦学团队。

数据互通·医院

在医疗健康领域,联邦学也具有广阔的应用前景,因为医院与医院之间在多数情况下是不做数据互通的。我们现在在宜昌联合了20多家医院一起构建了联邦学模型。这些医院提前识别中风病人的准确率从而为提升,平均准确率提升到80% 以上,最的提升量在20%,这就是联邦学在医疗的场景下非常有前途的一个方向。

5G 边缘计算·无人驾驶

联邦学所建立的数据互通,为5G 边缘计算提供了所谓的“杀手锏”应用。有很多5G场景需要多方建模,比如服务器和无人驾驶汽车之间的沟通,不仅需要在本地建立一个模型,而且需要本地具有建模的能力,这就是边缘计算。

边缘计算不能孤立地存在,要与服务器及其无人驾驶汽车沟通,这时候联邦学就会起作用。此外,联邦学也能应用于智慧城市的中,比如,通过加强建筑工地监控视频之间的联系,提升行人检测和安全检测的功能。

专家点评|巴曙松

隐私保护, 倒逼技术与金融创新

联邦学的概念最早于2016 年由谷歌提出,指多个客户在一个或多个服务器的协作下协同进行去中心化机器学的设置。在去中心化机器学的过程中,联邦学能够保证每个客户的隐私数据不出本地,从而降低了传统中心化机器学带来的隐私泄露风险和因数据泄露带来的相应成本,相关研究成果组成了联邦学的整体解决方案。

在金融行业应用场景中,普遍存在“主观上不愿意,风险合规上不敢,技术上不能共享数据”的问题,导致海量数据散落在众多机构和信息系统中,形成一个个数据孤岛。用户隐私、数据孤岛、数据商业化之间的矛盾一直与互联网的发展相随相伴。联邦学正好从技术的角度解决了这一困境。

联邦学在金融行业有非常广泛的应用场景。金融风控、营销风控是金融机构与互联网公司之间联邦学的典型应用领域。

从技术融合的角度看,联邦学是一种跨学科的解决方案,集合了机器学、统计学、加密学、分布式系统等学科技术。

在利用人工智能进一步挖掘数据潜在价值的趋势下,联邦学已经成为当下以及未来一段时间内,推动人工智能和机器学商业落地的关键能力之一。联邦学与5G、计算机视觉的结合,为无人驾驶、智慧制造、智慧出行等领域提供了支持。

技术的创新与金融的创新息息相关,相互推动,共同成为推动金融发展的重要动力,同时也在改变着金融行业的发展格。

宽带怎么连接路由器无线

路由器和交换机怎么串起来

华为光猫上的光纤怎么拔掉

宠物店怎么选好狗粮呢

带旋转屏相机怎么用的视频

圆通速递和快运有什么区别

怎么让精选照片栏隐藏

小红书值得去做吗未来前景怎么样

seo推广平台都有哪些

标签: