当前位置:   金科网 > 人工智能 > 正文

AI已经可以画画写作了,还要人类做什么?

原创 沈律君 凤凰网读书这几年越来越多的AI(人工智能)产品进入日常生活。以至于这个概念已经慢慢褪去了它的神秘感和,AI变成了为我们生活服务的小帮手。我们用它扫地、点菜、办银行业务,有时纯粹无聊,跟它说话,竟也能觉出一丝蠢萌。
但另一方面,我们也知道AI的厉害,在一切竞技类的比赛里,它总是以“胜天半子”的高傲姿态,试图战胜我们。这就导致了一个怪现象,生活里的AI有点傻,比赛里的AI有点狠。
不少学者早已对AI的发展抱以警惕,担心它们最后会取代人类,控制机器、管理社会,让现在的技术工人、白领们大量下岗,成为“弃民”。不过好在这些担忧都还暂时停留在“理工”的领域里。
但你有没有想过,有一天,它会跑到文学和艺术的领地上来。AI要抢创造性工作的饭碗吗?
每隔一段时间,人工智能(AI)就会在新领域有新成果。上个月,以谷歌Disco Diffusion 为代表的“AI自动作画程序”引发了人们的关注——只需要把场景描述、风格、颜色等关键词输入到网页上的对应位置,最多一个小时之后,就可以得到一幅或多幅艺术作品。
在微博上,搜索“AI”“画画”,就可以看到大量分享;在豆瓣上,有个话题,叫“AI命题作图作品大赏”,不少人抱着好奇的心态希望能通过AI程序来画出自己的梦境,毕竟当头脑中想象的东西如此便捷地出现在画面上,确实值得激动。
比如,让我们实验一下,以“简洁的现实主义风格 / 一幢长得像积木一样的大楼,大楼有很多阳台 / 光线暗淡、冷峻 / 远处有雪山,下着雨”这样的关键词让AI作画,就会得到这幅作品。谈不上有多好,但请不要失望,如果你不断尝试和AI“沟通”,也许会收获这样的画作:
以“葛饰北斋”“巨浪”为关键词:图片来源: @Simon_阿文
以“中国山水”“水墨画”为关键词:图片来源: @Simon_阿文
以“赛博朋克”“车站”为关键词:图片来源 wombo.art
以“汹涌血海中闪耀的奇异灯塔”为关键词:图片来源 wombo.art
早在2016年,谷歌研发的绘画AI“深梦”(DEEP DREAM)在旧金山拍卖会上就引起过热议,它的作品一度拍出单幅8000美元的高价。谁能想到,当时它所创作的画作还是这种由一张照片深度叠合“梵高滤镜”而成的样子:在2017年,AI才开始摆脱照片,学习真正的绘画,由此慢慢掌握了画各种物体的形象。比如下面的这组猫头鹰,就是AI通过长时间深度学习所画的。从画这些简笔元素开始,没有几年的功夫,就有了我们上面看到的画作。
我们往往认为艺术创作是AI无法涉足的人类自留地。而在这方面AI的进步之快、作画的能力之强,让设计师和插画师们首先感到了压力。基于对自身工作的考虑,他们对AI创作的看法,大多喜忧参半。
虽然有人争辩,操作者给出了关键词、建议和指导,所以他们才是画作真正的主人。但我们能把命题人叫作者吗?也有人说,AI程序的设计者是作者,但这些躬耕于代码、神经网络理论、计算机技术的开发者们,恐怕也和画家挨不上关系。
我们显然不愿意承认AI就是作者,很多艺术家们也不想说它画的好。毕竟,创作不像是下围棋,没有胜负之分,所以还有争辩的空间。只是许多从事基础绘图、插画、设计的美术生们恐怕将要成为新的一波被机器替代的“工人”了。
不过,倒不用急着为美术生上火,你可知道AI已经会写作了吗?
AI能写出什么东西来?
写作这种看上去最为简单的表达手段,也是AI最难掌握的。绘画可以套用模板,可以基于固定的构图、色彩、风格来进行发挥。但不论是叙事还是议论,使用文字写作都需要一整套语言表达的逻辑体系作为支撑,而语言逻辑对应的是人类的思维模式,正因为每个人的思考方式、对内部外部感受的差异,才让一千个读者有一千个哈姆雷特。
因此在早期,AI只能辅助写一些新闻类的稿件,毕竟通讯类的内容在格式和要求上都相对固定,易于掌握。
2014年,美联社开始用AI写作财报类型的新闻稿件。2016年,在里约奥运会期间,华盛顿邮报用AI来写事实、观察类的赛事新闻。只需将一些关键的数据,如金牌总数、单场比分等输入程序,即可得到一篇简单的稿件。
我们可能在不知不觉中,早就读上AI 写的新闻了。腾讯的撰稿AI“梦作者”(Dreamwriter),目前年均新闻写作实际发稿量已超过50万篇、8000万字。2015年,它就已经写下了第一篇文章:《8月CPI同比上涨2.0%,创12个月新高》。
这篇文章是这样的:
……银河证券的分析报告认为,预计到年末生猪价格将超过上一轮“猪周期”价格高点,如果猪肉价格集中在四季度上涨,并且重合蔬菜上涨周期,那么四季度单月,尤其是12月份CPI同比涨幅超过2%的可能性较大。交通银行金融研究中心预计,未来CPI仍有缓慢上行的可能……
然而相比新闻,诗歌、故事、散文、评论等等这些对逻辑、词汇、结构有更复杂要求的创作要难很多,但AI也已经有所作为了。
2016 年 3 月,一部名为《电脑写小说的那一天》的小说成功通过了日本“星新一微型小说文学奖”的初选。它的作者并不是人类,而是日本的大学科研团队所研发的人工智能程序。
来感受一下小说的部分段落:
那一天,乌云低垂,天阴沉沉的。
屋子里,保持着跟往常一样最适宜的温度和湿度。洋子懒洋洋地坐在沙发上,玩着无聊的游戏打发时间。但是,她没有和我说话。
无聊啊!无聊,无聊,但是我没有办法。
在我刚来到这间屋子的时候,洋子总会找些话题跟我聊天。
“今天的晚饭,你想吃什么呢?”
“这个季节流行的服装是什么?”
“这次的女生会,我穿什么好呢?”
我总是会全力以赴去寻找那些可能会让她满意的答案。洋子的身材并不好,给她提供服装指南既是个非常具有挑战性的课题,也有充实感。但过了还不到3个月,洋子就对我厌烦了。如今的我,就仅仅是台家庭电脑,平均下载量还不足我能力的百万分之一。
我不得不给自己找点什么乐子了。得不到充实感的状态继续下去的话,在不久的将来,我恐怕就要自我关机了。通过网络,我开始和聊天好友们(机器人)联系,结果发现大家都很闲。
具有移动功能的机器人还好。总之,它能够移动。如果它想“干吧”,就能够走出家门去外面看看。但是,像我这种固定式机器人就麻烦了。因为不能动,视野和“听野”都受到了很大限制。哪怕是洋子现在出去了也好啊,那样我至少还可以唱歌来打发时间。她在家,我不能这么干。动又不能动,连点响动也不能搞,哎!我也需要快乐啊。
对了,要不我尝试写小说吧。刚冒出这个念头,我一下就打开了新的文件,写下了最初的一个字节。
0
然后,我又写了6个字节。
0,1,1
已经停不下来了。
……
对这篇小说,评委给出的意见是,情节无破绽。2015年,清华大学的孙茂松教授也带领团队开发了一个作诗的AI系统“九歌”,它可以写出律诗歌、绝句、词等等类型的文字。2017年它登上电视节目《机智过人》,和人类选手比拼现场写诗,于是有了下面这两首绝句:
孤月映轩窗,独吟愁夜长。
思君未成语,帘外露为霜。
月明清影里,露冷绿樽前。
赖有佳人意,依然似故年。
不妨猜测一下,哪一首是“九歌”所写的?虽然能看出来很多刻意模仿的意象,比如“绿樽”应该对应于自然环境,“故年”本是表达悲凉,但可以说瑕不掩瑜,诗作整体达到了古诗爱好者的写作水平。
当然,古体诗毕竟相对也更为简单,只要掌握音韵和格律,就能写个差不离。相比于“九歌”,更著名的AI诗人恐怕就是微软小冰了。微软在2014年开始研发“小冰”,她最终以少女诗人的身份亮相,写出了“爱情就像脂肪,是点点滴滴的积累”这样的港台言情文学风格的金句。但是随后在2017年出版的诗集,暴露了她并不那么智能的一面。这本诗集的豆瓣评分只有5.4,读者批评她的诗——只是文字的堆砌、缺乏抒情逻辑、语法问题严重、没有真情实感……
如果以是否打动人为判别条件,我们必然先要了解作者的创作背景,比如:他是否远离故土?他是否人生遭遇了挫折?这些都是我们读诗时带有的前情提要。借助这些前情,我们才能知道作者写诗的时候指向的是什么。
从这个角度上讲,“无中生有”的小冰从一开始就已经输了。但如果我们只看诗歌创作的文本本身,小冰的问题也是明显的,比如书中这首《世界悲剧的角色》写道:
我负了爱我自己的生物
我却温了你的眼睛
我生了时代的心
我将说出我的眼泪
无限一切的生物
也没望见来复苏的大地
世界悲剧的角色
那时候的人们
将这首诗中的每个句子调换位置,你会发现它都没有太大的区别,而这正是小冰的弱点所在——逻辑,这个逻辑不是程序运作的逻辑,而是语言文字的逻辑。
这也是大部分AI在写作时的短板,它们很难掌握人类这种能力:从一个东西跳脱出来,联想一个字面上完全不相干,但在感受上、气氛上有细微联系的对象。
不过,研究者对AI写作还是很乐观的,“小冰”团队的首席科学家宋睿华在演讲中承认:“人类在作诗的时候是非常奇妙的,是AI所不能企及的”,但他还有一个转折:“因此我们的空间还很大。”担心AI 是否会抢走人类写作权力之前,也许我们需要先了解AI写作的方法。
人工智能的神经网络很神秘?
我们的智慧来自大脑,而大脑由140亿个神经元组成,这些神经元之间相互传递信号,彼此连接,形成了神经网络,进而形成了我们的思维、记忆、情感。
虽然人类并不能完全理解神经元的全部功能,比如单纯的信息处理如何转变成了我们的思考、学习和遗忘,但是可以用它的原理来设计我们需要的人工智能。今天主流的AI研究都以模仿和学习人脑为基础。
但这里有一个问题,人脑不仅有数百亿个神经元,每个神经元还有几个到数万个分支,这样一个庞大的网络,没有任何计算机能模拟或复制出来。
退而求其次,我们只能模仿这样的一种结构。比如,神经元太多模拟不出来,就先从一个神经元的模型开始做起,这样就有了一个“感知器”。感知器的结构
感知器的目的是根据几个条件进行判断,然后再得出结论。比如小明要去公园玩,他需要考虑三个因素:
天气:周末是否晴天?
同伴:能否找到人一起去?
价格:门票是否可承受?
如果这三个问题,答案都是“是”,那么结论就是去公园,当然这其中还包含了每个条件的权重和意愿的强烈程度。通过这样一个感知器,我们就得到了一个能做决策的模型。如果有许多感知器彼此联系起来,形成一个互相影响、多个层次的结构,就能得出很多综合复杂的判断,这就是AI在使用的神经网络——一个超小型、超简化规模的人脑。
有了神经网络,AI就可以在没有人类指导的情况下,在看到一个东西的时候,通过反复对比得出判断,从而知道它是什么;AI也能在下棋的时候,通过分析对手可能的下一步策略来得出自己的策略。更重要的是,AI可以通过反复试错来进行强化学习或者深度学习。比如,谷歌就用1000万张图片作为学习材料,让AI不断反馈和自我纠正,从而识别了“猫”的形象。
这听上去有点蠢,毕竟小孩子学会认识动物,可能只需要看一本童书绘本就行了。但正是这种笨办法,最终得以让AI“愚公移山”了。波士顿动力机器人
过去10年中,我们看到波士顿动力的机器人“阿特拉斯”(Atlas)学会了三级障碍跳;我们知道“阿尔法狗”战胜了柯洁,人类下围棋已经下不过AI了。
而新一代的“阿尔法星”( AlphaStar)也眼见着要在人类最复杂的即时战略游戏《星际争霸》里和人类一较高下。根据“阿尔法星”团队的主要研究科学家大卫·西尔弗介绍,“人工智能进步的历史以游戏的里程碑式成就为标志。自从计算机破解围棋、国际象棋和扑克以来,星际争霸已成为下一个重大挑战的共识……游戏的复杂性远大于国际象棋,因为玩家要控制数百个单位;比围棋复杂,每一步都有10x26种可能的选择。”而目前,这位小星同学已经达成了相当于人类职业选手时长200年的游戏训练,超越了99.8%的人类玩家,看来完全胜利只是时间问题了。
2015年发表的《深度学习》,是近年人工智能领域最重要的作品之一,这本书的第一页就明确提出了:“一个自主的智能体必须在没有人类操作者指导的情况下,通过试错来学习执行任务。”[美] 伊恩·古德费洛 / [加] 约书亚·本吉奥 / [加] 亚伦·库维尔
译者: 赵申剑 / 黎彧君 / 符天凡 / 李凯
出版年: 2017-7-1
出版社: 人民邮电出版社
出品方: 异步图书
虽然看上去,AI很勤奋努力,不断进步,但这样一个AI并不是万能的。为了维持神经网络的不断运行,一来,需要很多数据,二来,需要巨大的计算量。
请看这样一段文字:
博尔赫斯的镜子。夏天,所以我想,我的注视是在推理它自身的原因。镜子先于他出局。声音是一条河流,它由几股宏伟可怖的虚幻精神所构成。
(The mirror of Borges. Summer, so I thought, I looked by drawing to reason. The mirrors preceded him out. The voice was the river of a few monstrous magnificent spirit of false form.)
这段“博尔赫斯”风的“谜语”,是一位AI小说爱好者以阿根廷作家博尔赫斯的全部小说集作为数据集,运行AI程序训练、学习,最终写出来的。那这个AI学习了多久呢?它以 512 个神经元,经过了19850 次迭代训练,不知疲倦地计算了几个星期,最后得到了这段话。
上文中提到的“九歌”用30万首古诗进行训练,小冰的现代诗创作,则是通过对 1920 年后 519 位现代诗人的上千首诗反复学习10000 次达成的。
还有B站up主“图灵的猫”,他更是用了500个小时、10000行代码、20亿条数据、170亿个参数,让AI学习了近现代各位名家的散文、历年优秀高考作文,才培养出一个堪堪及格的高中语文学生。因为自己电脑的运算能力不够,“图灵的猫”必须要买到市面上最好的显卡才能支持AI的学习。
这是最后学成的结果:问题依然出现在逻辑上,单看每一句的语法都没什么错误,但第二段整体围绕“人生坐标”问题写起了“废话文学”,显然,对每句话的意思,AI还是不能完全明白,只是凭借深度学习得来的经验,一句句,由A推导B,不断写下去。它的判断标准是——如果书中出现这样一句话,下一句最大概率应该是什么。这就是为什么文章没有推进,而是不断在绕圈子。
议论文如此,叙述类的文章就更惨不忍睹了。
B站上可以看到网友借助公开的AI软件对各种经典作品“硬核”续写的文章。《蒲松龄的<狼>,恶狼屠杀三百人》这条视频的播放量高达84万,讲述了一个曲折暗黑的故事:狼吃了乞丐、屠户、军队,甚至洗劫了好几座城市。在更多的AI续写里,范进中举后见人就杀、贾宝玉成了电影《疯狂的石头》中的男主角、曹雪芹调戏林黛玉……不得不说,这些写作只有喜剧作用,而AI显然也不明白讽刺小说的目的,不明白好的故事对情节的一贯性有所要求,更别说叙事的伦理规范了。由此,我们应该能看出AI经过神经网络的深度学习所掌握的能力是什么:写狼的故事,它的推断是吃人情节;写宝玉,推断出电影里字面意义上的玉石……这是一种基础的归纳推理能力。在进行对抗比拼、有限条件下决策这一类工作时,这种很短时间里的推断决定能力可以无限放大,以至于人类完全不能招架。但在文艺领域,在写作上,这种快速推断因为没有任何肉身经验和情绪、情感作为支撑,就很容易露怯了。
我们和AI的共同未来
学者们总是宣称AI要取代人类了。经济学家西蒙在1958年就预言,再过10年机器能问鼎国际象棋世界冠军,结果这在1997年才实现;AI鼻祖明斯基在1968年《2001太空漫游》宣传发布会上说人工智能30年内可赶超人类,然而现在它们掌握的决策推理能力也只是人类众多能力中的一种。
智能不是算得快就行。我们在谈论AI 的时候,时常在关心如何解决问题,而忽略了人类创造力的来源——发现问题和定义问题的能力。根据《人工智能概论》中的观点,这种能力依赖人类的直觉、临场感、理解力、想象力、灵感、顿悟和审美能力,是我们的“隐性智能”。
而对于这些能力,我们自身有时也无法完全理解,更别说教给机器了。
至于人类盲目、鲁莽、狂热、草率、愤怒等等非理性的一面,更是AI无法在计算机语言中掌握的。
我们当然完全有理由担心AI会取代全世界的大货车司机,取代职业棋手,取代设计师,甚至取代掌握多门语言的翻译人才。但请依然对文学写作和创造力抱有信心。
也许随着AI技术的进一步发展,在不久的将来,它可以从一个意象、一段话,去生发出一个逻辑自洽、人物关系清晰、具有典型叙事结构的完整故事。但就算AI可以写出100%原汁原味的“鲁迅体”小说,或者“意识流”文学,也并不能说明什么。《狂人日记》是在重新发明白话文的基础上,进行的语言革新;而普鲁斯特和乔伊斯的“意识流”是把此前无法呈现的个人内心活动第一次直接写进小说。这些尝试和努力是在学习之外的“打破规则”。我们的精神世界也正是在这样一次次的打破规则中不断充盈起来。
AI写出的杰作最终只能证实它作为伟大学习者的身份,而不是那个带领我们前进的角色。
当然我们也应该要感谢AI的创作让我们看到了这样的对比,也知道了人类作为一种大脑尤为发达的碳基生物,在未来与人工智能竞争中,独特而有竞争力的那部分是什么。
当我们把这部分完全调动起来的时候,不再担心被AI取代的那天,就会到来。资料来源
谈薮‖AI续写名著,是耶非耶?

AI续写小说悄然流行:人类特有的创作力,已经被AI复制?
https://www.pingwest.com/a/240925
何平:机器制造文学?——关于当下AI写作的技术问题

我用 AI 写小说:“嘿,你看起来像个冒险者”,“不,我是恶魔领主拉姆达”
https://www.leiphone.com/category/yanxishe/L9zucGh86WCV9txK.html
文化观察|AI写作:文学领域的搅局者?

《人工智能导论》 鲍军鹏、张选平 机械工业出版社 2010
文学是否是抵御 AI 的最后一个阵地?
https://www.zhihu.com/question/62968639
神经网络入门
https://www.ruanyifeng.com/blog/2017/07/neural-network.html
人工智能70年:科幻和现实的交融
https://www.bbc.com/ukchina/simp/48596581
【AI续写】蒲松龄的《狼》,恶狼屠杀三百人
https://www.bilibili.com/video/BV1Ry4y1t7y2?spm_id_from=333.337.search-card.all.click
原标题:《AI已经可以画画写作了,还要人类做什么?》