|  首页  |  资讯  |  评测  |  活动  |  学院  |  访谈  |  专题  |  杂志  |  产服  |  
您现在的位置:硅谷网> 学院> 经验>

如何区分了解人工智能,机器学习和深度学习?

2017-03-17 18:04 作者:Lake Dai 来源:硅谷网 HV: 编辑:GuiGu 【搜索试试

本文内容来自于硅谷投资人Lake Dai,LDV Partners合伙人。严肃编辑整理。

人工智能(Artificial Intelligence)是一个最广泛的概念,人工智能的目的就是让计算机这台机器能够象人一样思考,而机器学习(Machine Learning)是人工智能的分支,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,使之不断改善自身的性能。

深度学习(Deep Learning)是一种机器学习的方法,它试图使用包含复杂结构或由多重非线性变换构成的多个处理层(神经网络)对数据进行高层抽象的算法。

神经网络是一组大致模仿人类大脑构造设计的算法,用于识别模式。神经网络通过机器感知系统解释传感器数据,能够对原始输入进行标记或聚类等操作。神经网络所能识别的模式是数值形式,因此图像、声音、文本、时间序列等一切现实世界的数据必须转换为数值。

在深度学习网络中,每一个节点层在前一层输出的基础上学习识别一组特定的特征。随着神经网络深度增加,节点所能识别的特征也就越来越复杂,因为每一层会整合并重组前一层的特征。

(http://fortune.com/ai-artificial-intelligence-deep-machine-learning/)

上图显示了一个神经网络用于判定一个图片是不是一条狗的过程,输入是图片,通过深层神经网络对狗的低层特征进行抽象,最后输出是图片是狗的概率。

深度学习的过程同样是分为训练和推理(既“评估”)两个过程,通过训练过程来获得数据模型,然后用于评估新的数据。

数据模型分为两种,一种是所谓判别模型(Discriminative Model),也就是说模型可以直接用来判别事物的。这里所说的判别事物,最典型的就是做分类。既然直接可以用来分类,也就是说我们可以在已知属性的条件下,对该记录进行判断。所以,判别模型是对条件概率进行的建模,也就是p(Y|X)。这里X就是属性集合,实际上就是一个向量;而Y则可能是一个值(此时对应分类问题), 可能是一个向量(此时对应序列标注问题)。判别模型常用于处理分类问题(比如鉴定垃圾邮件)、图像识别等等。

再说一说生成模型(Generative Model)。生成模型可以描述数据的生成过程。换句话说,已知了这个模型,我们就可以产生该模型描述的数据。而数据由两部分组成,也就是(X,Y),前者是特征,后者则是类别(Y是标量)或者序列类别(Y是向量)。要描述整个数据,也就是要对p(X,Y)进行建模,所以是对联合概率进行建模。生成模型本身不是做分类或者序列标注的,但是可以用来解决这些问题,也可以用于生成式问题,比如聊天机器人、比如AI谱曲等问题。

而机器学习可以分成下面几种类别:

监督学习从给定的训练数据集中学习出一个函数,当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求是包括输入和输出,也可以说是特征和目标。训练数据中的目标是由人标注的。常见的监督学习算法包括回归分析和统计分类。

无监督学习与监督学习相比,训练集没有人为标注的结果。常见的无监督学习算法有聚类。

半监督学习介于监督学习与无监督学习之间。它主要考虑如何利用少量的标注样本和大量的未标注样本进行训练和分类的问题。。

增强学习通过观察来学习做成如何的动作。每个动作都会对环境有所影响,学习对象根据观察到的周围环境的反馈来做出判断。

在传统的机器学习领域,监督学习最大的问题是训练数据标注成本比较高,而无监督学习应用范围有限。利用少量的训练样本和大量无标注数据的半监督学习一直是机器学习的研究重点。

当前非常流行的深度学习GAN模型和半监督学习的思路有相通之处,GAN是“生成对抗网络”(Generative Adversarial Networks)的简称,包括了一个生成模型G和一个判别模型D,GAN的目标函数是关于D与G的一个零和游戏,也是一个最小-最大化问题。

GAN实际上就是生成模型和判别模型之间的一个模仿游戏。生成模型的目的,就是要尽量去模仿、建模和学习真实数据的分布规律;而判别模型则是要判别自己所得到的一个输入数据,究竟是来自于真实的数据分布还是来自于一个生成模型。通过这两个内部模型之间不断的竞争,从而提高两个模型的生成能力和判别能力。

(图片来自Nvidia Deep Learning Training Workshop)

目前主流的深度学习框架:

Caffe 由Berkeley提出

TensorFlow 由Google提出 (Apache 2.0)

Torch (BSD License), facebook是主要使用者

MXNet 一个相对中立的机器学习框架(Apache 2.0), 被Amazon AWS使用

CNTK2 由Microsoft提出 (MIT License)

人工智能在各个行业的公司分布

(图片来源 http://www.shivonzilis.com/)

目前人工智能在各个领域的初创公司数量(2016年的数据):

Deep learning/机器学习 (通用)(123家公司)

Deep learning/机器学习 (应用) (260家公司)

NLP (通用) (154家公司)

NLP (语音识别) (78家公司)

计算机视觉/图像识别 (通用) (106家公司)

计算机视觉/图像识别 (应用) (83 家公司)

手势控制 (33 家公司)

虚拟个人助理 (92 家公司)

智能机器人 (65 家公司)

推荐系统 (60 家公司)

Context aware computing (28 家公司)

语音即时翻译 (15 家公司)

视频识别 (14 家公司)

下图是目前人工智能在各个行业的热度

上图是2011到2016年最积极的人工智能企业投资者

下图是福布斯关注的50家人工智能公司。

(图片来自http://fortune.com/2017/02/23/artificial-intelligence-companies/)

融资最多的人工智能初创公司(2011-2016)

Sentient Technologies:使用先进的人工智能技术,大规模分布式计算和科学的方法来验证新发现的策略,Sentient Technologies为各种领域中的复杂问题提供了新的解决方案。

Ayasdi:机器学习平台,数据可视化,分析,金融技术,医疗保健代理系统:

Vicarious: 这是一家神秘的人工智能公司,Vicarious的目标定位于“建立下一代的人工智能算法”。并且声称要构建“像人类一样思考的软件”,实现“人脑级别的视觉、语言和自动控制系统”,致力于研究通用人工智能,目前他们的研究重点是实现人工视觉识别系统。

Context Relevant:Context Relevant通过使用机器学习驱动的自动化数据科学平台,来解决一些世界上最棘手的大数据,预测和行为挑战 - 比任何其他解决方案更快更有效。

Cortia:Cortica的技术模拟人类皮层,以便以最高的精度理解和识别图像。

Workfusion:WorkFusion是全球运营的完整自动化解决方案,将您需要的复杂业务流程数字化所需的核心功能整合到一个平台中:业务流程管理(BPM),机器人过程自动化(RPA),劳动力编排和机器学习提供的认知自动化。

RapidMiner:开源预测分析平台,使企业能够在业务流程中包括预测分析

Digital Reasoning Systems:确保合规性,保持安全性,并快速准确地分析信息。

H2O.ai:H2O是世界领先的开源深度学习平台。 H2O被超过80,000个数据科学家和超过9,000个组织使用。

Viv Labs:Viv在开发语音智能助理,已被三星收购。

参考文献:

http://fortune.com/ai-artificial-intelligence-deep-machine-learning/

https://en.wikipedia.org/wiki/Artificial_neural_network

http://fortune.com/2017/02/23/artificial-intelligence-companies/

https://www.amazon.com/b?ie=UTF8&node=16008589011#

http://techemergence.com/artificial-intelligence-industry-an-overview-by-segment/

Nvidia Deep Learning Training Workshop

Crunchbase

CB Insights

【对“如何区分了解人工智能,机器学习和深度学习?”发布评论】

版权及免责声明:
① 本网站部分投稿来源于“网友”,涉及投资、理财、消费等内容,请亲们反复甄别,切勿轻信。本网站部分由赞助商提供的内容属于【广告】性质,仅供阅读,不构成具体实施建议,请谨慎对待。据此操作,风险自担。
② 内容来源注明“硅谷网”及其相关称谓的文字、图片和音视频,版权均属本网站所有,任何媒体、网站或个人需经本网站许可方可复制或转载,并在使用时必须注明来源【硅谷网】或对应来源,违者本网站将依法追究责任。
③ 注明来源为各大报纸、杂志、网站及其他媒体的文章,文章原作者享有著作权,本网站转载其他媒体稿件是为传播更多的信息,并不代表赞同其观点和对其真实性负责,本网站不承担此类稿件侵权行为的连带责任。
④ 本网站不对非自身发布内容的真实性、合法性、准确性作担保。若硅谷网因为自身和转载内容,涉及到侵权、违法等问题,请有关单位或个人速与本网站取得联系(联系电话:01057255600),我们将第一时间核实处理。
广告
相关
·如何把苹果iPhone手机的照片传到苹果Mac电脑?
·server服务:server服务自动停止关闭如何解决?
·苹果电脑MAC系统登录远程桌面 如何能够实现?
·苹果电脑系统MAC OS如何安装Yummy FTP程序?
·如何快速看懂商业模式?盈利模式+服务模式+组织
·如何申请百度新闻源?百度新闻源申请方法步骤!
·编辑html,如何把导航栏固定在网页底部随屏幕移
·html如何把导航栏固定在底部随浏览器移动?
头条
新闻来源很重要?将近一半读者根本不关心它! 新闻来源很重要?将近一半读者根本不关心它!
在网络主页上发新闻的好日子早就过去了。今天的受众更愿意把超过一半的流量花在社交媒……
·新闻来源很重要?将近一半读者根本不关心它!
图文
如何把苹果iPhone手机的照片传到苹果Mac电脑?
如何把苹果iPhone手机的照片传到苹果Mac电
mcafee是什么软件好用吗?McAfee中文译名是什么?
mcafee是什么软件好用吗?McAfee中文译名是
自媒体账号如何申请?各个平台运营方法汇总!
自媒体账号如何申请?各个平台运营方法汇总
如何把苹果iPhone手机的照片传到苹果Mac电脑?
如何把苹果iPhone手机的照片传到苹果Mac电
最新
·巴西5G不排除华为是什么情况?为何巴西5G不排除华
·如何把苹果iPhone手机的照片传到苹果Mac电脑?
·硅谷有多大面积?美国硅谷有多大?面积多少?
·iframe怎么用?iframe标签属性iframe写法详解!
·mcafee是什么软件好用吗?McAfee中文译名是什么?
热点
·做客、作客、座客和坐客的意思和区别是什么?
·硅谷为什么叫硅谷?硅谷到底是什么意思呢?
·知道UV、VV,CV是什么?PV、UV、IP什么意思?
·自媒体账号如何申请?各个平台运营方法汇总!
·目前微信有什么bug?微信bug是什么意思啊?
旧闻
·简易教程:如何将iPad mini快速升级到iOS 7 b
·从事游戏策划,工作中中最难的一点是什么?
·CAXA二维CAD教程:把图纸名默认为文件名
·百度新闻源:百度新闻源审核、被清理、解封办
·苹果电脑MAC系统登录远程桌面 如何能够实现?
广告
硅谷影像
如何把苹果iPhone手机的照片传到苹果Mac电脑?
如何把苹果iPhone手机的照片传到苹果Mac电脑?
mcafee是什么软件好用吗?McAfee中文译名是什么?
mcafee是什么软件好用吗?McAfee中文译名是什么?
什么是域名纠错系统?怎么关闭域名纠错系统?
什么是域名纠错系统?怎么关闭域名纠错系统?
董事长属于高管吗?公司董事属于公司高管吗?
董事长属于高管吗?公司董事属于公司高管吗?
server服务:server服务自动停止关闭如何解决?
server服务:server服务自动停止关闭如何解决?
怎么关闭域名纠错系统?什么是域名纠错系统?
怎么关闭域名纠错系统?什么是域名纠错系统?
关于我们·About | 联系我们·contact | 加入我们·Join | 关注我们·Invest | Site Map | Tags | RSS Map
电脑版·PC版 移动版·MD版 网站热线:(+86)010-57255600
Copyright © 2007-2020 硅谷网. 版权所有. All Rights Reserved. <京ICP备12003855号-2>