本文作者:方弦

翻译自Popular Science(原文链接),首发于果壳实验室

在2015年的夏天,谷歌的研究人员意识到,他们可以让他们的人工智能程序“做梦”。他们调整了程序,使得它不仅能将图像分门别类,还能在图像中强化观察到的事物。然后,这些机器就展示了他们对艺术的诠释。

研究人员发现,他们可以调整程序,让它们生成图像,从中可以看出机器认为某些物件看起来应该像什么样子。这个发现正好遇上了“机器能成为具有创造性的工具”这个逐渐蔓延的思潮。

在谷歌“Deep Dream”眼中米开朗基罗的《创造亚当》

在谷歌“Deep Dream”眼中米开朗基罗的《创造亚当》,创作者是数字艺术家凯尔·麦克唐纳(Kyle McDonald)

大约一年之后,谷歌发布了“品红计划”(Project Magenta),这是一个探索性的团队,他们将会进行有关创造性和人工智能的实验。这个团队会专注于创造各种形式的艺术——首先是音乐,然后是视频和其他视觉媒介上的艺术。

“在品红计划中,我们希望探索技术的另一面——开发一些算法,使机器能学习如何生成艺术和音乐,它们也许还能独自创造出迷人优雅的内容,”道格拉斯·埃克(Douglas Eck)在品红计划博客的第一篇帖子这样写道。

品红计划公布的第一个项目是一首简单的乐曲,基调是《一闪一闪小星星》的前四个音符。它的作者是谷歌的研究员埃利奥特·韦特(Elliot Waite)。这首乐曲用数字钢琴演奏,一开始只是简单笨拙的音符,但之后越来越复杂精微,说实话,里边还有几个不错的乐句。(鼓声是后期人工加上去的。)

艺术人工智能

自人工智能这个领域开辟以来,研究者们就一直在试着捣鼓一个能作出创造性选择的人工智能。被视为现代人工智能之父的马文·明斯基(Marvin Minsky),在1960年写下了这样的话:“我确信终有一天我们能得到拥有强大的解决问题能力的程序,方法是以错综复杂的方式组装一大堆启发式的部件——多目标优化、模式识别技巧、规划代数、递归管理过程等等。但在这些程序中,没有智能安坐。”

智能不单是模式识别,但寻找智能的“位置”是个棘手问题,它一直困扰着人工智能研究者,还有心理学家。

马蒂娜·罗斯布拉特(Martine Rothblatt)是Sirius XM的创始人,她进行有关未来学的写作,还是机器人伴侣Bina48的负责人。她说,要具有真正的创造性,机器必须能够创造更多新东西,而不只是它们见过事物的随机取样。

“最重要的元素是独有的特质。如果你写的是一个只会随机混合一些元素的程序,那么它没什么创造性。”罗斯布拉特在穆格音乐节(Moogfest)这样告诉我们,“很多时候就是情有独钟。如果它看上去独一无二,那么人们就会觉得有创造性。”

人们已经进行了数以千计的项目,尝试跨过这个“感觉”新颖有创造性的门槛,尤其是在视觉艺术和音乐的生成方面。他们尝试重现毕加索绘画某个21世纪场景的方法,或者贝多芬超乎想象的感性。

原照片被转换为不同艺术家的风格


原照片(左上)分别被转换为不同的风格:特纳(J.M.W. Turner)的《米诺陶战舰的倾覆(The Shipwreck of the Minotaur)》风格(右上)、文森特·梵高(Vincent van Gogh)的《星夜(The Starry Night)》风格(左下)、以及爱德华·蒙克(Edvard Munch)的《呐喊》风格(右下)。作者是
贝特格实验室的安德烈亚斯·普雷符克(Andeas Praefcke)

这些绘画项目从属于人工智能研究中一个名为风格转移(style transfer)的子领域,它们在重现和运用著名艺术家的笔触上非常成功。在德国贝特格实验室里进行的研究中,研究人员能将毕加索、梵高、康定斯基和蒙克的风格应用到数字图像上。

要做到这一点,他们利用物体识别算法来忽略油画中被描绘的物体,只关注这些物体是如何画出来的。通过这种方法,他们能从内容中抽离风格,从而更准确地分开研究它们。

推陈出新?

但有些人也许会说,这不过是在聚集已有的人类创造成果,并不是什么全新的东西。

未来学家雅龙·拉尼尔(Jaron Lanier)在微软领导着一个研究团队,他第一个提出了“虚拟现实”(virtual reality)这个术语。他说他并不认为机器以后能具有创造性。“人工智能靠回收利用源自人们的数据来工作,”拉尼尔告诉我们(Popular Science),“它从根本上还是源自人类,问题在于这些人被匿名化了。我们在等式上划去了自己。”

人工智能研究者、网站CreativeAI的创始人以及博客“伦理机器”(Ethical Machine)的主播之一的萨米姆·威尼格(Samim Winiger)说,创造性是一种运作方式,而不是某种火花或者继承而来的天赋。“这跟创造过程有关,它是一种做事的方式。你学着变得有创造性,跟你学着演奏吉他一样。”威尼格这样说,“从这个角度来看,它就不那么神秘了,而你可以试着利用这些工具去优化你自己的流程。”

威尼格将这些工具看作对人类创造性进行增强而非替换的一种方式。在他的设想中,服装店可以根据用户的偏好来生成一件礼服,然后当场把它制造出来。“到了那个时候,你可以想像类似H&M的店会有多巨大的改变,”威尼格这样说。

而我们的确逐步靠近这个设想——今年,IBM的Watson帮助时装公司Marchesa为纽约大都会慈善晚会(Met Gala)设计了一套礼服,对颜色和质料给出了指导建议。

在制作过程中,Marchesa给了Watson五种情绪的选择:愉悦、激情、兴奋、鼓舞和好奇。Watson分析了Marchesa以往制作的服装,通过连接颜色和情绪的工具,它给新服装设计了一套调色板。然后,Watson把40000种面料的选择缩减到150种,然后向设计师推荐了其中35种。

埃克写道,品红计划的目标是创造真正自动生成的音乐和艺术。也就是说,从单单一台电脑开始,仅仅靠点击一个按钮,就产生一部音乐作品,其中包含了人类作曲家会加入的所有元素。

品红计划也会探索如何通过主题的反复和音乐的特性将叙事融入生成的音乐中。整个过程将会对大众公开,而内部测试也会在品红计划的GitHub页面公开。