当前位置:   金科网 > 人工智能 > 正文

AI辅助人的视觉需要跨过多少坎

2007年7月,林宥嘉以大学生的身份站上了《超级星光大道》第一季的踢馆赛,翻唱了一首歌曲,从此为人所熟知。

这首歌就是被传唱一时的《你是我的眼》,原唱者萧煌奇是一一位视障人士,失明的人生中,他一直保持乐观态度,热爱音乐与创作,一首以自己为原型的《你是我的眼》横空出世,给所有黑暗中的视障人士带来了鼓励与温暖。

但是你能想象吗?有一天,视障人士可能会深情款款地对AI唱起“你是我的眼/带我领略四季的变化/你是我的眼/带我阅读浩瀚的书海……”

当AI要承担起“眼睛”这个角色时,要如何才能将这个世界带到视障人士的面前呢?利用高科技来“作眼”,又是否切合了视障人士的真正需求?

从感知到“看见”:层出不穷的“助视”产品

不得不说,巨头们在推进前沿技术的同时,一直没有忘记对视障这一弱势群体的关怀。一大批助力视障患者的产品和技术如雨后春笋般涌现,这些产品里流露的温情不仅体现了企业对视障群体的关怀,也是对科技巨头最好的品牌广告。

智能相对论(aixdlun)分析师颜璇梳理了各类与视障有关的智能产品,大致将其分为三种类型:

AI辅助人的视觉需要跨过多少坎

1、曲线救国型:还记得我们一直拿来做作文论据的海伦凯勒吗?海伦·凯勒的老师在教她认“water”时,让她伸出一只手去感知水的流动,并在海伦的另一只手上拼写了这个单词。从这里我们可以看出,目不能视的视障患者认知外界世界的渠道是除了视觉之外的其它感官感觉,比如听觉、嗅觉和触觉。

基于此,慕尼黑公司和韩国公司联合完成了一款专供盲人使用的盲文智能手表(Dot Watch),搭载了盲文显示系统,以盲文的形式将各种信息呈现在手表的触摸表盘里。

相机也给出了触摸形式。美国一位设计师专门为视障人士设计了一款to see 3D相机,这款相机能通过镜头实时地将拍摄的物体转化成三维触感数据,使视障人士通过触摸屏幕表面生成的立体形状来识别面部细节,比如读取表情等。

当然了,除了触觉,听觉的更不会少。IBM 推出了无障碍环境的一项发明——专为盲人设计的新型导航 APP NavCog.NavCog 可通过耳机与智障人士“耳语”,帮助人实时识别位置、朝向,还能辨认迎面走来的熟人。

2、外力加持型:这种类型的载体一般是智能眼睛,主要是为弱视群体(即视力不到常人的 60%)打造。

比如一款名为eSight的产品,结合算法和部分盲人自身的需要,通过控制器中的液体镜头技术进行“聚焦”,弱视者可以利用眼镜中的 Bioptic 倾斜功能,不仅可以调整瞳孔距离(对焦),还可以调整图像的清晰度(颜色、对比度、亮度),从而“重获光明”。

3、直截了当型:视觉的产生依赖于三大组织器官:眼球(主要为视网膜)、视神经、视皮层。对于视障患者而言,如果想要“一了百了”,恢复视觉,就必须研发出能替代这三种组织的假体,即视网膜假体、视神经假体和视皮层假体。

国内就有研究团队制作出了人造视网膜,其由体内电子微系统和体外电子系统两部分组成。使用方法是在患者眼球内部植入IC芯片,用来接收信息和传导电信号。然后再为盲人配备一个体外接收系统,比如眼镜。

“眼前的黑不是黑,你说的白是什么白”

即使现在的智能“助视”产品比比皆是,但要真的掀开视障患者眼前的帘子,恐怕还不容易。

人造视网膜技术具有很强的综合性和复杂性,需要机器视觉、IC设计、半导体工艺、纳米技术、神经科学、生物材料等十多个学科的科学家和工程师全力投入,密切配合,缺一不可。但即便拥有如此高精度团队,外界信息通过电信号传递到大脑中,盲人感受到的也不过是一个灰度的、马赛克的世界。

即使是黑白的“渣像素”,也能勉强算“看见”了。而不能算“看见”的那些智能产品,比如智能眼镜、认知助手等,仅仅只能提供语音让患者接收到相应信息。患者能做的就是,在“助手”说前面有障碍物请绕过去时无奈绕开,而不能亲眼看看阻拦自己的障碍物究竟是一个石头还是一辆单车。

当我们不断加大视障患者在其它感官上接受的信息量时,也会带来不小的后患。比如,从听觉入手的产品往往会让使用者戴上耳机,这就会让盲人与周遭的声音隔绝,出行在外容易造成危险,而不带上耳机进行电子播报,容易造成患者的信息外泄。