当前位置:   金科网 > 人工智能 > 正文

下一个AI寒冬的隐患如何去解决

“我现在就在做一线的事情,防止(人工智能)冷下去。”当被问及眼下这一波人工智能热潮是否会像历史上的几波一样昙花一现,国际人工智能理事会(IJCAI)主席、香港科技大学计算机科学与工程系主任杨强这样告诉澎湃新闻记者。

在他看来,如今的人工智能虽已突破了计算能力和数据资源的瓶颈,但隐患埋伏在一个“偏”字上。例如学术研究方面,国内高校虽然开始设立人工智能学院和专业,五年内有望培育出一批AI人才,但不少大学直接将机器学习等同于人工智能,逻辑学、神经学等冷门领域研究和国外的差距很大。

下一个AI寒冬的隐患如何去解决

类似地,人工智能产业发展迅速,却过多地偏重计算机视觉在安防领域的布局,许多需求未得到充分挖掘。

近年来,杨强所做的就是超越深度学习专用于一个领域的框架,开拓出迁移学习、联邦学习等在两个或两个以上的领域之间进行的机器学习方法。

他希望能让多方在不泄露各自数据隐私的情况下实现数据的共享和模型的共建,打破数据割裂的孤岛。在这样的合作框架下,各方享有平等的地位和一定的“主权”,但走向“共同富裕”,就像一个联邦国家。

杨强正与微众银行等机构合作,试图用联邦学习打通人工智能应用的最后一公里,促进人工智能在金融、城市管理等领域的落地。“人工智能算法的数据得不到更新,就像一台好车没有汽油。”

这位1961年出生的计算机科学家是首位当选国际人工智能协会(AAAI)院士的华人。他似乎很擅长跳出主流偏重的视角来看问题。例如,当许多人在讨论机器能否像人一样实现无监督的学习,杨强却认为无监督学习是一种假象,人类的监督学习隐藏得很深。如果算法做得足够好,就能像人类一样从简单的一张照片上提取到无数个标签。

此外,人类的大脑“软件”得到无数称颂,但“硬件”优势却往往被忽略。杨强注意到,人浑身上下都是精妙的传感器,帮助人脑获取信息。在硬件发展没有跟上的情况下,光用算法实现通用的强人工智能只能是奢望。

“只不过大家现在都在摘比较低垂的果子,还没有深入去想。”杨强说道。

以下为澎湃新闻记者与杨强的对话实录。

联邦学习:人工智能应用的最后一公里

澎湃新闻:可以说从深度学习到迁徙学习、联邦学习,存在一种递进的关系?

杨强:迁移学习和联邦学习之间的共性都是在两个或两个以上的领域之间进行,这和深度学习是截然不同的。深度学习和以前的各种学习都是在一个领域进行。

在两个领域进行,第一层的考虑是知识的迁移共享,第二层考虑就是加密和安全。

比如说原来有一个保险公司,它对车险的定价基于一些很粗的维度,像驾驶员的年龄和车龄。为什么只能做这么粗的定价?因为它对用户的了解非常少。如果有一个码农张三年纪很轻,但开车却很小心,这一点它就无法了解,也无法进行个性化。

现在它可以和一个移动互联网公司合作。运营商那边有张三的行为数据,但对保险领域并不了解。它们两边需要合作,但又不愿意把数据暴露给对方,以防失控和监管不严的问题。

联邦学习恰恰就是在这可以帮忙,不交换数据,但可以在重叠的数据上建立一个更好的模型。

澎湃新闻:目前联邦学习有哪些落地场景?

杨强:横向联邦学习的场景是各方都有一部分用户数据,这些用户都不一样,他们可以利用加密的共享共建模型来得到一个更好的模型。但是这个模型不必用到所有用户的数据,我们假设有1000万的手机用户,你可以在里面选比较有用的300万,建立起横向的模型,分散到上千万的用户。

还有一个是纵向联邦学习,意思是两个机构同样进入这个数据,但是维护不一样。比如一个收集用户的年龄性别,另一方收集用户的学习成绩和平时的衣食住行。

具体到金融领域的案例,横向联邦学习的场景是很多家不同银行的维度是一样的,都了解信用、还款情况等信息,但用户是不一样的,因为它们位于不同的城市。

而纵向联邦学习是同一个城市,同样一个用户,但是他在接受不同的金融服务。比如面对小微企业的贷款,我们需要了解这些企业的税收情况和经营情况,但银行没有这部分数据。我们就可以找一些专门处理发票的机构来合作。

除此之外,我们也在探索一些非常不一样的业务。举个例子,我们跟一个深圳的公司合作,他们是做工地安全的视频检测,有没有着火、工人有没有戴帽子等等。但不同的工地、不同的公司不愿意交换这种数据,就可以用联邦学习来建立一个联邦模型,这样一个工具要比单独的数据更靠谱。

澎湃新闻:从实验室走向产业落地的困难主要有哪些?