document.write('
')

当前位置:   金科网 > 人工智能 > 正文

脸书人工智能背后的人工:将用户私人数据标注外包给了印度人

  

脸书人工智能背后的人工:将用户私人数据标注外包给了印度人

  

  

引领智能科技发展的Facebook(脸书),也有不智能的一面。为了更好地训练自家的人工智能(AI)系统,Facebook将用户私人社交内容标注工作外包给了印度合同工。这样的行为也引发了大众对于Facebook数据安全的讨论。

  

对于数据标注工,许多人或许并不陌生。像许多科技公司一样,Facebook使用机器学习和AI系统在其平台上对内容进行排序。但为了做到这一点,需要对软件进行训练,以识别不同类型的内容。为了训练这些算法,科技公司必须分析样本数据,所有这些都需要由人类进行分类和标记。这些人是人工智能背后的人工,也被称为智能时代背后的隐形者。

  

据路透社报道,Facebook将部分的数据标注工作外包给了印度公司WiPro。该公司雇用了260多名工人,以五个类别对用户发布的私人帖子进行标注。例如,帖子的内容(是自拍或食物图片)、场合(是生日还是婚礼)、作者的意图(他们是开个玩笑,试图激励他人,还是组织一个聚会)。为了保证数据标注的准确性,每条内容由WiPro的两名工人检查准确性,每个工人每天注释大约700条内容。

  

Facebook确认了WiPro的工作,并表示WiPro工人正在检查和标注的内容包括选定数量的用户私人共享内容,其中部分数据包含用户姓名和其他敏感信息。同时,Facebook表示,公司在全球范围里有200个类似的项目,总共雇佣了数千人。尽管Facebook表示,外包出去的数据标注工作得到了公司法律和隐私团队的批准,但鉴于Facebook之前在数据安全上的表现,许多用户仍表示担忧。

  

在人工智能时代,对于机器学习和深度学习等算法来说,数据量越大、质量越好,算法模型就表现越好。可以说,数据决定着整个人工智能行业的发展态势。Facebook人工智能产品管理总监Nipun Mathur认为,这类工作是人工智能的核心。

  

但标注工作本身是一个劳动密集型工种,收入也不高,听上去有点像呼叫中心的工作。因此,大部分的公司将这类工作外包给了人工较为便宜的国家。在中国,也有大量的“数据标注者”每天对着电脑,标记供自动驾驶汽车学习的图像,以便训练他们识别自行车和行人。

  

为了更好的智能化,数据标注工作是必要的,但当标记的数据涉及到用户个人隐私时,问题就来了。比如前段时间闹得沸沸扬扬的某购物App窃听事件,许多用户怀疑该应用程序监控或是窃听了自己的社交内容,从而生成推荐商品推送给了自己。

  

当你和你的朋友交谈聊天时,你不认为有其他人会听到你们的谈话,但现在这变成了可能。尤其是当大公司将你的数据外包给那些采用更低安全标准和隐私的公司时,问题变得令人更加不安。