|  首页  |  资讯  |  评测  |  活动  |  学院  |  访谈  |  专题  |  杂志  |  产服  |  
您现在的位置:硅谷网> 资讯> 软件>

深度要让AI学会思考,可能要先教会它画画

2017-06-16 12:27 作者:佚名 来源:雷锋网 HV: 编辑:何睿 【搜索试试

今年4月,Google推出AutoDraw绘图功能,让AI帮助人类画画,只需几笔就能创作出艺术家等级的线条画。这个有趣的AI应用一下让业界随之兴奋。虽然从目前流出的成果来看,AI的笔画还有些稚嫩,但这压根不妨碍Google对其背后的AI系统向大众进行高调科普,比如发布了一些科普倾向的Paper等。背后的AI系统名为 SketchRNN,是Google新设的 Magenta 项目的一部分,以测试 AI 能否用来做艺术。

为更好地了解这一项目及其背后的故事,theatlantic大西洋杂志采访了 Magenta 项目的负责人Doug Eck。雷锋网对采访内容做了编译。

Eck 是蒙特利尔大学(被视为人工智能的温床)的一名教授,同时也供职于Google。他此前曾负责Google Music,现转自Google Brian里工作。2000年在印第安纳大学取得计算机科学学士学位后,Eck在音乐和机器学习方面都有着非常丰富的从业经验。

关于SketchRNN这一AI系统,如果大家想更加形象地理解它,可从以下三幅画来看:

当人类被要求画一只小猪和一辆卡车时,可能会是这样的画风:

深度 | 让AI学会思考,可能要先教会它画画

但是,当被要求画一只“猪车”时,你可能会直观混合二者的显著特征而画成这样↓

深度 | 让AI学会思考,可能要先教会它画画

虽然画笔看起来仍然很稚嫩,但是这一混合后的产物其实就跟利用人工智能系统SketchRNN输出后的成果有点相似。正如Eck和他在Google的合作者David Ha的介绍,SketchRNN的工作原理可以理解为“以类似于人类的方式概括抽象概念”。

以前文的例子来说明,即Google并不想创建画“猪”的机器,而是由此创建的机器能识别和勾勒出“猪”的概念或特征。一言以蔽之,即人类在画一个物体时,会在脑中存储关于这一物体的概念和显著特征,并让“如何画”和“存储特征”之间产生联系。而SketchRNN的意义就在于让机器学习到人类的这种“综合能力”。

为此,Google建立了一个名为“Quick, Draw!”的游戏,像人类玩的方式一样,Google为该游戏制作了大量人造图形数据库。训练资料则包括75种物品,像是猫头鹰、蚊子、花园或是斧头,每种资料含有至少 7 万笔个别范例。依靠“Quick, Draw!”获得的绘画数据,Google研发了 SketchRNN 的AI系统。

当人类在草绘时,丰富多彩的嘈杂世界只能压缩在铅笔的几个线条里。这些简单的笔画就是SketchRNN的数据集。每一类物体的绘画,如猫、瑜伽姿势、雨等,都可以使用Google的TensorFlow开源平台软件库来训练某个特定类型的神经网络。当机器以梵高或原始DeepDream的风格呈现一张照片时,人类总感觉有点儿怪异,因为机器对物体的概念或显著特征并不能融合的那么灵活或了无痕迹。

这些项目能以神秘而又主观的方式来感受人类,但是有趣的在于,它们对真实世界的感知与人类相似但又不完全相同。

不过,SketchRNN 的输出结果却毫无怪异感。Eck说:

“我不想说它的方式“非常人类”,但是它的感知比那些像素生成的图片看起来像那么回事多了。”

这也是Eck领导的 Magenta 团队的核心洞察力。“人类了解世界的方式并不同于像素,而是以开发抽象概念来代替我们所看到的事物”,Eck和Ha在他们的论文中作如是表述,“从小时候起,我们就开发了通过绘画来向他人沟通我们所看到的东西的能力。”

所以,如果人类能做到这一点,Google相信机器同样可以做到。去年,Google的CEO Sundar Pichai就宣布了"AI First”的未来发展战略。对于该公司而言,AI是其原始使命的自然延伸,“组织世界的信息,让其变得通用和有用”。所以,Google正尝试使用AI的方式组织信息,让人们可以访问并和使用这些信息。而 Magenta 项目正是Google在该愿景下的一次尝试。

机器学习是Google近年来常用的方式,其中,一种特定的机器学习方式就是使用大致基于人类大脑连接系统建模的神经网络。而多层次的神经网络在解决棘手问题时特别有效,尤其是在翻译和图像识别方面。Google已经在这些新架构上重建了很多核心服务。

拿Google翻译举例,它虽然已经是一个建造了10年以上的复杂系统,但是Google最终通过深度学习花了9个月的时间对该系统完成了重建。所以在这种情况下,神经网络的使用和类型在近几年实现了爆炸式增长。

基于神经网络的基础,SketchRNN使用了一种生成递归神经网络。根据Google在论文中介绍,该种类型的神经网络可生成简单物体的草图,目的是训练一个能绘画和概括抽象概念的机器,并且它的思维方式与人类类似。

描述训练的最简单的方式,就是将其作为一种编码方式。在输入数据(草图)后,该神经网络尝试在所处理的数据中总结出一些概括性的规则。这些概括性的规则就是数据的模型,会被存储在描述网络中神经元特性的数学中。

这种过程被称为潜在空间或“Z”(zed)。它能吸取在整个训练过程中学到的东西,如一只猪、一辆卡车或一个瑜伽姿势的特性等都会存储其中,“Z”再对它们进行抽样。

那么,SketchRNN 能学到什么?以下就是一个接受消防车训练的网络神经生成新的消防车的例子。在该模型中,有一个“温度”的变量,研究人员可以上调或下调输出的随机性。在下列图像中,偏蓝色的表示“温度”较低,偏红色的则表示“温度”较高。

深度 | 让AI学会思考,可能要先教会它画画

或者你会更想看到猫头鹰:

深度 | 让AI学会思考,可能要先教会它画画

或者最好的例子——瑜伽姿势:

深度 | 让AI学会思考,可能要先教会它画画

从以上这些案例来看,SketchRNN输出的成果已经和人类的风格非常相似,但是它们本身并非人类所画。或者说,它们正对人类可能会绘画某种事物的方式进行重建。当然,其中有些重建的非常好,有些则不尽然。

同时,SketchRNN也能以人造图像的形式接受输入。当人类输送一些内容进去,SketchRNN会尝试弄明白它。以下就是一个正在接受猫的数据训练的模型,在这只三眼猫的图像中你会发现哪些变化?

深度 | 让AI学会思考,可能要先教会它画画

从上图可以看出,从左往右的各种输出中,第三只眼睛被去除了。因为模型知道,猫有三角形的耳朵,胡须,圆形的脸,且只有两只眼睛。

当然,模型并不知道耳朵到底是什么,或者脸是什么样的。它对这些草图所示的世界一无所知。但它确实知道人类是如何描绘猫、猪或帆船的。

Eck说到,“当开始生成帆船图时,模型会输入进数百个其他型号的帆船,这些帆船可能来自该图。这对我们来说是有意义的,因为模型已经从所有这些训练数据中生成了理想的帆船。“

训练一个可以画雨点的网络,然后输入一个云的草图,它会这样做:

深度 | 让AI学会思考,可能要先教会它画画

雨滴会从输入模型中的云那落下来。那是因为很多人画雨滴时,会先画云,然后画落下来的雨。所以如果神经网络看到一个云,它会让雨落在该形状的底部。 (有趣的是,如果先画雨,模型不会产生云。)

这是一项有意思的工作,但是在对人类思维进行反向工程中,这种项目有什么意义呢?

Eck对述描感兴趣,是因为它们内涵丰富但包含的信息很少。画一个笑脸只有几个笔画,甚至就是一些像素集合,但任何3岁以上的人都可以辨认出是一张脸,甚至区分是幸福或悲伤的脸。Eck认为这是一种压缩,是SketchRNN可以解码的编码,甚至可以重新编码。

OpenAI的研究员Andrej Karpathy也对SketchRNN的工作很感兴趣。OpenAI也是人工智能研究的一个中心。但他也指出,这个项目要满足很多前提条件,这意味着它对企业开发人工智能不会有太大的帮助。

“我们开发的生成模式通常会尽可能地与数据集的细节无关,无论你输入什么数据,都应该能用,包括图像、音频、文本或其他任何东西。除了图像,其它都不是由笔画组成的。”

Eck和Ha正在开发的,更接近于能玩国际象棋的AI,而不是一个可以玩任何游戏的AI。所以对Karpathy来说,他们目前工作的范围似乎有限。

但有一些理由认为,线条图是人类思考方式的基础。Google员工并不是唯一被草图的力量所吸引的研究者。早在2012年,乔治亚理工学院的James Hays与慕尼黑理工大学Mathias Eitz以及Marc Alexa,就合作创建了一个草图数据集,以及一个用于识别它们的机器学习系统。

对于他们来说,草图是一种“通用交流”形式,所有具有标准认知功能的人都可以做到这一点。他们认为,自史前时代以来,人类已经以素描岩画或洞穴绘画的方式来描述世界了,这种象形文字比语言的出现早了几十万年,如今绘制和识别草图的能力已经是基本了。

多伦多大学神经科学家Dirk Walther在一篇论文中指出,简单抽象的草图会以与真实刺激类似的方式,激活我们的大脑。Walther的假设是,线条图代表了我们自然世界的本质,因为在像素的基础上,一些猫的线条怎么看都不会像是一只猫。

草图可能是一种帮助我们掌握存储对象概念层次的方式,即我们说的“本质”。也就是说,他们可能会告诉我们,在过去10万年的时间里,当我们的祖先逐渐现代化时,人类如何开始思考的。草图、洞穴壁画,可能描绘出我们怎么从日常经验走向抽象的。

大多数现代生活都有这种转变:语言,金钱,数学,以及计算本身。因此,如果草图确定能在创造重要的人工智能方面发挥重要作用,也是合情合理的。

当然,对于人类来说,草图是对真实事物的描绘。我们可以很容易地理解抽象线条与实际事物之间的关系。这个概念对我们来说意义重大。

对于SketchRNN,草图就是笔画序列,形状是通过时间形成的。机器的任务是提取出图纸中描绘的东西的本质,并尝试用它们来了解世界。

SketchRNN团队正在许多方面进行探索。他们可能会建立一个系统,试图通过人类反馈来得到更好的结果。他们可以用多种草图来训练模型。也许,他们会找到一种方式,来看看他们的模型是否可以推广到逼真的图像。但他们自己承认SketchRNN是第一步,有很多要学习的东西。

深度 | 让AI学会思考,可能要先教会它画画

人类艺术的历史不是技术时代能相比的。

而对Eck来说,他们更多的是想了解人类如何思考的基础,在他看来,艺术的一个核心部分是,它代表了基本人性。要理解深度学习,也需要理解人类生活的基本机制,即我们如何看见世界,如何交谈,如何认识面孔,如何将单词构成故事,如何编曲。它看起来没有与任何一个特定人类有关,但却代表了抽象的人类。

【对“深度要让AI学会思考,可能要先教会它画画”发布评论】

版权及免责声明:
① 本网站部分投稿来源于“网友”,涉及投资、理财、消费等内容,请亲们反复甄别,切勿轻信。本网站部分由赞助商提供的内容属于【广告】性质,仅供阅读,不构成具体实施建议,请谨慎对待。据此操作,风险自担。
② 内容来源注明“硅谷网”及其相关称谓的文字、图片和音视频,版权均属本网站所有,任何媒体、网站或个人需经本网站许可方可复制或转载,并在使用时必须注明来源【硅谷网】或对应来源,违者本网站将依法追究责任。
③ 注明来源为各大报纸、杂志、网站及其他媒体的文章,文章原作者享有著作权,本网站转载其他媒体稿件是为传播更多的信息,并不代表赞同其观点和对其真实性负责,本网站不承担此类稿件侵权行为的连带责任。
④ 本网站不对非自身发布内容的真实性、合法性、准确性作担保。若硅谷网因为自身和转载内容,涉及到侵权、违法等问题,请有关单位或个人速与本网站取得联系(联系电话:01057255600),我们将第一时间核实处理。
广告
相关
·ZAO隐私风险显露 而投资机构已思考它的商业模式
·谋变与赋能,F5谈深度数字化转型中的渠道变革
·华为云产品DevCloud布道师的思考与点滴实践
·矿爷王景平深度解读分布式文件系统IPFS发展未来
·斯坦福最新深度学习测试:华为云ModelArts排名第
·OpenStack与ZStack深度对比:架构、运维监控等
·达观数据 2018Qcon 分享深度学习前沿应用
·索尼入局深度学习,推出免费深度学习程序开发软
头条
“魔搜”软件开发者张某被判刑1年2个月缓刑1年10个月 “魔搜”软件开发者张某被判刑1年2个月缓刑1
一个取名魔搜的软件篡改消费者在电商平台的购物浏览记录,企图通过数据造假制造爆款。……
·“魔搜”软件开发者张某被判刑1年2个月缓刑1
·45款应用程序遭谷歌下架 猎豹移动股价惨跌16.
·腾讯会议一星好评,如何占得线上视频会议市场
·高仿APP捞钱套路:蹭官方、发广告、索取隐私
·报告称APP的支出和使用率在2019年达到创纪录
图文
“远程办公”战线拉长,如何确保“私有化”办公?
“远程办公”战线拉长,如何确保“私有化”
友盟+智能认证:用户增长始于头,体验提升只需1.3秒
友盟+智能认证:用户增长始于头,体验提升
知米背单词APP那些不为人知的小细节(图)
知米背单词APP那些不为人知的小细节(图)
Realme引入广告什么情况 Realme广告怎么设置关闭?
Realme引入广告什么情况 Realme广告怎么设
最新
·“远程办公”战线拉长,如何确保“私有化”办公?
·友盟+智能认证:用户增长始于头,体验提升只需1.3
·“魔搜”软件开发者张某被判刑1年2个月缓刑1年10
·字节跳动称旗下办公产品飞书被微信全面封禁
·疫情下的危机,如何通过“信源豆豆”实现企业安全
热点
·群控、云控时代即将终结,智控时代已到来
·106短信群发平台APP,致力于成为领域内佼佼者
·DT小听App:防偷拍,还是用这款国产app(图)
·软件技术行业发展变化非常快,软件人才要按需
·嗨学网一级消防可靠吗?新手妈妈亲生经历告诉
旧闻
·漂亮有创意的思维导图怎么画?办公也有小技巧
·社会“抢票软件”存隐患随时有可能被屏蔽
·微软发布2013年首批补丁 暂未修复IE漏洞
·喜推人工智能名片:看懂客户心,销售才能更欢
·全国多地上线电子社保卡 微信10秒即可申领
广告
硅谷影像
“远程办公”战线拉长,如何确保“私有化”办公?
“远程办公”战线拉长,如何确保“私有化”办公?
友盟+智能认证:用户增长始于头,体验提升只需1.3秒
友盟+智能认证:用户增长始于头,体验提升只需1.3
“魔搜”软件开发者张某被判刑1年2个月缓刑1年10个月
“魔搜”软件开发者张某被判刑1年2个月缓刑1年10
打响“科技防疫战” 中软国际解放号在行动
打响“科技防疫战” 中软国际解放号在行动
钉钉5.0新增在线办公室、圈子,满足用户个性化需求
钉钉5.0新增在线办公室、圈子,满足用户个性化需
钉钉5.0产品见面会 彩蛋Real如我曝光号召无压力分享
钉钉5.0产品见面会 彩蛋Real如我曝光号召无压力分
关于我们·About | 联系我们·contact | 加入我们·Join | 关注我们·Invest | Site Map | Tags | RSS Map
电脑版·PC版 移动版·MD版 网站热线:(+86)010-57255600
Copyright © 2007-2020 硅谷网. 版权所有. All Rights Reserved. <京ICP备12003855号-2>