应用办公生活信息教育商业
投稿投诉
商业财经
汽车智能
教育国际
房产环球
信息数码
热点科技
生活手机
晨报新闻
办公软件
科学动态
应用生物
体育时事

策略产品经理必读系列第六讲深度学习与神经网络

  一、人工智能、机器学习、深度学习是什么1。1人工智能是什么
  在介绍深度学习之前,先和大家介绍一下AI和MachineLearning,才能理清AI、MachineLearning、DeepLearning三者之间的关系。
  1956年8月,在美国汉诺威小镇的达特茅斯学院中,几位科学家在会议上正式提出了人工智能这一概念,这一年也被称为人工智能元年。在此之前,人类已经制造出各类各样的机器如汽车、飞机等,但这些机器都需要经过人来操作使用,无法自己具备操作的能力。科学家探讨能不能制造出一个可以像人类大脑的一样思考的机器,拥有人类的智慧,这就是人工智能。
  同时科学家们也对AI未来的发展畅想了三个阶段:
  大家在电影上看到的各种AI都是强人工智能,但目前我们仍处在弱人工智能阶段,什么时候进入强人工智能阶段未知。强人工智能阶段,机器可以完美媲美人脑,像人类一样有情感地、批判性地去思考。同时可以快速学习,拥有极强的自学能力。
  那么如何实现人工智能了,实现人工智能的方法是什么了?
  1。2机器学习是什么
  实现人工智能的方法我们统称为机器学习。同样是1956年的美国达特茅斯会议上,IBM的工程师ArthurSamuel正式提出了MachineLearning这个概念,1956年真的是特殊的一年。
  机器学习既是一种实现AI的方法,又是一门研究如何实现AI的学科,你可以理解为和数学、物理一样的学科。机器学习,简单来说就是从历史数据中学习规律,然后将规律应用到未来中。国内大家一致推荐的,南京大学周志华教授的机器学习教材西瓜书里面如此介绍机器学习。
  机器学习是机器从历史数据中学习规律,来提升系统的某个性能度量。其实人类的行为也是通过学习和模仿得来的,所以我们就希望计算机和人类的学习行为一样,从历史数据和行为中学习和模仿,从而实现AI。
  简单点讲,大家从小到大都学习过数学,刷过大量的题库。老师和我们强调什么?要学会去总结,从之前做过的题目中,总结经验和方法。总结的经验和方法,可以理解为就是机器学习产出的模型,然后我们再做数学题利用之前总结的经验和方法就可以考更高的分。有些人总结完可以考很高的分,说明他总结的经验和方法是对的,他产出的的模型是一个好模型。
  既然有了机器学习这一方法论,科学家们基于这一方法论,慢慢开始提出了各类各样的算法和去解决各种智能问题。就像在物理学领域,物理学家们提出了各种各样的定理和公式,不断地推动着物理学的进步。牛顿的三大定律奠定了经典力学的基础。而传统机器学习的决策树、贝叶斯、聚类算法等奠定了传统机器学习的基础。
  1。3深度学习是什么
  但是随着研究的不断深入,传统机器学
  习算法在很多智能问题上效果不佳,无法实现真正的智能。就像牛顿三大定律,无法解释一些天文现象。在1905年,爱因斯坦提出了相对论,解释了之前牛顿三大定律无法解释的天文现象。同样2006年,加拿大多伦多大学教授GeoffreyHinton对传统的神经网络算法进行了优化,在此基础上提出了DeepNeuralNetwork的概念,他们在《Science》上发表了一篇Paper,下面链接是那篇文章:http:www。cs。toronto。eduhintonscience。pdf
  引起了DeepLearning在学术界研究的热潮。2012年GeoffreyHinton老爷子的课题组,在参加业界知名的ImageNet图像识别大赛中,构建的CNN网络AlexNet一举夺得冠军,且碾压第二名(SVM方法)。也正是因为该比赛,DeepLearning引起了工业界的关注,迅速将DeepLearning引进到工业界的应用上。深度学习技术解决了很多传统机器学习算法效果不佳的智能问题,尤其是图片识别、语音识别和语义理解等。某种程度上,深度学习就是机器学习领域的相对论。
  将人工智能和机器学习带到了一个新高度的技术就是:DeepLearning。深度学习是一种机器学习的技术。
  同时大家应该听到过一大堆的学习名词:机器学习、深度学习、强化学习等等。在这里面机器学习是爸爸,是父节点;其他都是它儿子,是子节点。AI、MachineLearning和DeepLearning的关系可以通过下图进行描述。
  让机器实现人工智能是人类的一个美好愿景,而机器学习是实现AI的一种方法论,深度学习是该方法论下一种新的技术,在图像识别、语义理解和语音识别等领域具有优秀的效果。
  那么深度学习到底是一门什么技术?深度到底代表什么?
  二、深度学习与神经网络
  介绍深度学习就必须要介绍神经网络,因为深度学习是基于神经网络算法的,其实最开始只有神经网络算法,上文也提到2006年GeoffreyHinton老爷子提出了DeepLearning,核心还是人工神经网络算法,换了一个新的叫法,最基本的算法没有变。学过生物的都知道神经网络是什么?下图是生物神经网络及神经元的基本组成部分。
  人类的大脑可以实现如此复杂的计算和记忆,就完全靠900亿神经元组成的神经网络。那么生物神经网络是如何运作的了?可以参照下图:
  通过神经元接收外界信号,达到一定阈值,触发动作电位,通过突触释放神经递质,可以是兴奋或抑制,影响突触后神经元。通过此实现大脑的计算、记忆、逻辑处理等,进行做出一系列行为等。同时不断地在不同神经元之间构建新的突触连接和对现有突触进行改造,来进行调整。有时候不得不感叹大自然的鬼斧神工,900亿神经元组成的神经网络可以让大脑实现如此复杂的计算和逻辑处理。
  科学家们从生物神经网络的运作机制得到启发,构建了人工神经网络。其实人类很多的发明都是从自然界模仿得来的,比如飞机和潜艇等。下图是最经典的MP神经元模型,是1943年由科学家McCulloch和Pitts提出的,他们将神经元的整个工作过程抽象为下述的模型。x1,x2,x3,xn:模拟生物神经网络中来自其他神经元的输入;1,2,3,n:模拟生物神经网络中每个神经元对外接收的突触强度不同,所以外界接收的输入乘以一定权重;Sum:模拟生物神经网络中神经元对外接收的信号进行累加汇总;Bias:模拟生物神经网络中神经元的一般敏感性。每个神经元的敏感性不同,所以需要一定的偏差来调整汇总值;ActivationFunction:模拟生物神经网络中信号累积到一定程度产生的动作电位,当累积到一定程度就会激活动作电位。实际使用时我们一般使用Sigmoid函数;Output:模拟生物神经网络中神经元对外释放的新的信号;
  现在我们知道了最简单的神经元模型了,我们如何使用该模型从历史数据中进行学习,推导出相关模型了。我们使用上述MP模型学习一个最简单的二分类模型。
  如上图,为了训练简单,我们训练集里面只有两条数据。同时激活函数,我们也是最简单的激活函数,当()0时输出为1,当()0时输出为0。然后对于参数的更新规则UpdatedRule,我们使用的SequentialDeltalearningrule和BackPropagation算法,该规则和算法不详细介绍了,可以理解为就像物理、数学领域一些科学家发现的普适性定理和公式,已经得到了证明,用就完事了。
  因为Input只有1个值x1,所以初始设定参数1,同时还需要一个Bias,我们将Bias设定为0。上述两个参数,我们需要从历史数据中学习出来,但是最开始我们需要一个初始值,假设初始值为12,01。5;然后我们通过不断地更新迭代最终1和0将稳定在两个固定的值,这就是我们最终通过一个简单MP模型学习出来的参数。下图是整个更新迭代学习的过程:
  大家可以看到上图最后一次循环已经不再发生变化,说明〔0。5,1〕就是最终我们学习出来的固定参数。那么上述整个过程就是一个通过神经网络MP模型学习的全过程。下图是最终学习出来的Classifier分类器,我们带入一个新的数据,就可以进行Class预测了。
  2。3何为深度
  上文我们已经介绍了人工神经网络经典的MP模型,那么在深度学习里面我们使用的是什么样的神经网络了,这个深度到底指的是什么了?其实就是如下图所示的,输入层和输出层之间加更多的HiddenLayer隐藏层,加的越多越深。
  最早的MP神经网络实际应用的时候因为训练速度慢、容易过拟合、经常出现梯度消失以及在网络层次比较少的情况下效果并不比其他算法更优等原因,实际应用的很少。中间很长一段时间神经网络算法的研究一直处于停滞状态。人们也尝试模拟人脑结构,中间加入更多的层HiddenLayer隐藏层,和人脑一样,输入到输出中间要经历很多层的突触才会产生最终的Output。加入更多层的网络可以实现更加复杂的运算和逻辑处理,效果也会更好。
  但是传统的训练方式也就是我Part2。2里面介绍的:随机设定参数的初始值,计算当前网络的输出,再根据当前输出和实际Label的差异去更新之前设定的参数,直到收敛。这种训练方式也叫做BackPropagation方式。BackPropagation方式在层数较多的神经网络训练上不适用,经常会收敛到局部最优上,而不是整体最优。同时BackPropagation对训练数据必须要有Label,但实际应用时很多数据都是不存在标签的,比如人脸。
  当人们加入更多的HiddenLayer时,如果对所有层同时训练,计算量太大,根本无法训练;如果每次训练一层,偏差就会逐层传递,最终训练出来的结果会严重欠拟合(因为深度网络的神经元和参数太多了)。
  所以一直到2006年,GeoffreyHinton老爷子提出了一种新的解决方案:无监督预训练对权值进行初始化有监督训练微调。
  归纳一下DeepLearning与传统的神经网络算法最大的三点不同就是:训练数据:传统的神经网络算法必须使用有Label的数据,但是DeepLearning下不需要;训练方式不同:传统使用的是BackPropagation算法,但是DeepLearning使用自下上升非监督学习,再结合自顶向下的监督学习的方式。对于监督学习和非监督学习概念不清楚的读者可以阅读我上文引用的强化学习文章,里面有详细介绍。层数不同:传统的神经网络算法只有23层,再多层训练效果可能就不会再有比较大的提升,甚至会衰减。同时训练时间更长,甚至无法完成训练。但是DeepLearning可以有非常多层的HiddenLayer,并且效果很好。
  不管怎么样DeepLearning也还是在传统神经网络算法基础上演变而来的,它还是一种基于神经网络的算法。
  三、深度学习框架
  大家了解了深度学习和神经网络以后,相信大家也经常听到如下的英文单词:Tensorflow、Caffe、Pytorch等,这些都是做什么的了。Tensorflow是Google旗下的开源软件库,里面含有深度学习的各类标准算法API和数据集等,Pytorch是Facebook旗下的开源机器学习库,也包含了大量的深度学习标准算法API和数据集等。Caffe是贾扬清大神在UCBerkeley读博士时开发的深度学习框架,2018年时并入到了Pytorch中。
  因为深度学习发展至今,很多算法都已经是通用的,而且得到过验证的了。
  那么有些公司就希望将一些标准算法一次性开发好,封装起来,后面再使用时直接调用引入即可,不需要再写一遍。就像大家小时候学习英文一样,英文字典有牛津版本的,也有朗文版本的。对于收录的英文单词,英文单词如何使用,如何造句等,已经有了标准的用法。我们只需要查阅这些字典即可,而Tensorflow、Caffe、Pytorch做的其实也就是计算机届的牛津、朗文英文大词典。国内百度目前也有自己的深度学习框架PaddlePaddle。
  目前一般是学术界用Pytorch较多,Pytorch更适合新手入门,上手快。工业界用Tensorflow较多,更适合工业界的落地和部署等。
  四、深度学习在工业界主要应用领域
  目前深度学习应用最广泛的就是传统机器学习算法解决不了的领域或者是效果不佳的领域:视觉、自然语言和语音识别领域。当样本数量少的时候,传统机器学习算法还可以通过一些结构化特征组合在一起然后区分出来。
  比如区分汽车和摩托车,可以通过轮子数量。但对于人脸,千万张人脸相似的太多,已经完全无法通过鼻子、头发、眼睛这些简单的特征组合进行区分了。需要探索更多更复杂的特征,组合在一起才能将千万张人脸区分开来。
  所以这时候就需要DeepLearning构建多层神经网络,探索组合更多的特征,才能识别区分千万级别甚至亿万级别的人脸。这在传统神经网络算法和机器学习算法是完全实现不了的。
  当然实现上述功能,也是因为现阶段有了更多的数据可以进行训练,同时有了更好的算力可以快速完成训练。传统的CPU进行训练,可能训练几个月都训练不出来结果。GPU的出现和改进加速了上述训练过程。
  目前应用最广的一些领域:CV:计算机视觉领域。随处可见的人脸识别、物体识别和文字识别OCR。广泛应用于安防领域,同时零售行业也在通过CV技术实现线下门店的数字化。目前国内头部公司就是CV四小龙:商汤、旷视、云从、依图;NLP:自然语言处理领域。目前整体的NLP技术还是不够成熟,无法实现人们设想的机器人可以完全智能对话,机器人目前只能做一些简单的信息提取和检索整合的事情。NLP目前也是最难做的,同样一句话可能会有不同种意思。人有时都很难理解,更何况机器。目前国内头部公司主要是百度和达观;ASR:语音识别领域。目前国内独一档就是科大讯飞,尤其是能够做到很多地方方言的精准识别。语音识别目前主要主要用在语音客服上,有时候大家接到的推销电话其实背后都是电话机器人打的。电话机器人能够完全和用户进行对话,一定程度上也需要NLP的技术,因为它需要理解用户的意思。Autopilot:自动驾驶其实也是CV的衍生领域,目前世界上做自动驾驶最好的其实还是汽车公司比如特斯拉。因为没有车,自动驾驶想获得训练数据都很困难。没有车,自动驾驶技术想实验都跑不通。目前国内百度差不多算第一档。推荐:传统的推荐都是用GBDTLR模型来做的,目前深度学习在推荐领域也得到了广泛的应用,下面是深度学习在美团点评里搜索推荐的应用可以阅读一下。
  本文由KingJames原创发布于人人都是产品经理。未经许可,禁止转载。
  题图来自Unsplash,基于CC0协议

正式放弃周琦!广东真核或霸占顶薪,他是杜锋第1王牌,不是周鹏202122赛季CBA休赛期已经过了有一段时间,在半决赛遗憾出局的广东队依旧没有实质性的补强消息传出。截止至今,广东队已经先后与中国男篮最强内线周琦、深圳队当家球星沈梓捷以及广……面粉的新吃法,一包一烙一煎,外皮酥脆,肉质鲜嫩,咬一口满嘴香大家好,我是80后的宝妈,谁也抵挡不住对美食的诱惑。接下来分享一道早餐小吃。一。还是先和面,首先盆中倒入500克普通面粉,加入260克温水,边倒边搅拌,搅拌成棉絮状,用手……缅怀中国女排前主教练李耀先临危受命,汉城奥运会拿第三6月20日,中国排球协会官方发布唁电,中国女排前主教练李耀先不幸因病去世,享年87岁。接受新京报记者采访时,中国女排前队长李国君直言恩师像父亲一样,唯一跟随中国女排获得5连冠的……游明十三陵,庆陵记游明十三陵,庆陵记撰文:草衣摄影:玄远明十三陵坐落于北京市昌平区天寿山麓,整个陵区既是一个统一的整体,各陵又自成一个独立的体系。陵墓分别建于一座山前,除思陵偏……天刀删号事件之我见天刀土豪删号事件刷爆网络,事件起因:斗鱼某论剑DD主播登录一个区服神威大弟子时,意外漏出其账号仓库里拥有不存在当前版本的道具(此道具严重影响游游戏平衡)随后该直播画面被截图疯狂……不近女色真能养生吗?中医这可能是个大笑话开头先给大家讲一个故事,从宋代的一位有名的官员说起。这个官员,名字叫包恢。人家是宋宁宗嘉定年间进士,历任郡县,最后官至政殿学士,封南城县侯。他的最大特点,就是随着年……差距!丁俊晖44被拿赛点,30小高潮绝杀北京时间10月25日消息,2021斯诺克德国大师赛资格赛第一轮继续进行。中国一哥丁俊晖24被拿到赛点情况下追成44,决胜局错失绝杀,45不敌马克戴维斯。同轮另一场比赛,44岁老……S11入围赛REDVSHLE,HLE能否保持小组第一悬念?比赛时间:2021年10月6日22:00整体分析:HLE在首日与LNG的比赛中吞下败仗,目前取得1胜1负的战绩,LNG目前未尝一败。HLE若想继续保留争夺小组……拍照性能最强的几款手机,iphine13pro仅排第三,华为三星GalaxyS21Ultra三星GalaxyS21UltraHAI标配高通骁龙888移动平台,这颗芯片采用5nm工艺。三星GalaxyS21Ultra采用新升级的1。……公示打假!体操名将冒充世界冠军接代言,官方对此正式作出回应在体育界,有一些选手退役之后总会借着自己的名号来接代言或者是做宣传,本来是没有任何影响的,毕竟这些选手都是靠着自己的荣誉在赚钱,但让网友乃至体育界都无法忍受的是选手虚构自己的名……自由之刃魂环攻速打架升什么赤月龙城凤凰传奇防御有用么自由之刃(同款:赤月龙城、凤凰传奇)三端互通折扣手游,今天给大家介绍一些赤月龙城提升防御的技巧,在打架中帮助很大,自由之刃礼包、充值折扣滴滴。首先是战旗系统,升级战旗可以……2021唯美榜出炉唯品会发布年度十大美妆品牌,国货大爆发2021年即将过去,回看今年剁过的手,哪些品牌最受关注?哪些单品是必囤爆款??近日,唯品会发布2021年度唯美榜,包含《年度热销美妆品牌榜》和《年度美妆爆款单品榜》。基于……
庆余年2新消息,张若昀等7位演员回归,肖战成特别出演导语:在整个娱乐圈中,明星们的工作分的特别细,有人是专门靠唱歌、跳舞博关注,有的是靠上综艺,而有的人就跟张若昀似的,靠演电视剧、电影等被人喜欢。就拿《庆余年》这部作品来说……荆楚测评第七期网红藕粉产品里真的有藕粉吗?老婆饼里没有老婆好理解,可藕粉产品里如果没有藕粉,你能接受吗?本期荆楚测评选购了12藕粉产品进行检测,包括疯狂小杨哥、东方甄选、李子柒等网红大V推荐款。为确保检测结果真实……黄牙的姐妹们听我说!想要去渍白牙,用牙粉准没错!!!美白是几乎所有人的追求,不管是皮肤还是牙齿,谁都不会嫌自己太白!现在市场上美白的方式成千上万,如何做到在保证健康的前提下最大程度的美白我们的牙齿呢?为了把自已的这一……冬游西藏的6种极致体验,让旅行回归最初本真冬游西藏是熙攘之后的宁静质朴中带着炙热像是暖阳照耀在心上雪山冰川、湖泊河流苍穹星宿、人间烟火摄影师旅拍地图这是一年当中的时光沉淀……跟着精品线路游红河边境风光行摄之旅来源:【云南日报】河口、金平、绿春,是红河州的三个边境县,有着亚热带气候温润潮湿的环境,而风景各自不同,各具特色。这一趟旅程,我们一起走进这三地,以镜头之眼,徜徉边境风光……这个妆火了,我的赖床时间又多了3分钟有没有人记得,2005年左右,年轻群体中很流行头发少。每次理发时都要求把头发打薄,再用直板夹拉直,扎起来只有一小缕儿,风一吹飘飘的。再看看现在人人乞讨多发量的今天,……拆东墙补西墙!克洛普时代红军引援策略分析啃老终酿恶果北京时间2月4日晚,利物浦将在英超联赛第22轮比赛中客场挑战狼队。刚刚关闭的冬季转会窗口,红军除了4200万欧元签下荷兰国脚前锋加克波之后,急需补强的中场并没有新援加盟,这也让……国漫姜子牙何为斩善?0hr1、两极分化《姜子牙》口碑与影评两极分化严重,比《哪吒》的口碑好评一边倒其实更具有批评的意义。一部作品,从文本成为作品,加入接受美学批评的影响,由读者和作者共同支撑……开拓者险胜老鹰!利拉德轰426,博格达失关键罚球,穆雷空砍4头条创作挑战赛北京时间1月31日,NBA常规赛继续进行,亚特兰大老鹰客场挑战开拓者队,本场比赛老鹰队核心因为脚踝酸痛缺席,而利拉德迎来里程碑时刻,生涯助攻数突破5000次……张家口赤城入选省全域旅游示范区日前,省文化和旅游厅发布关于第四批省级全域旅游示范区认定名单的公示,经市级文化和旅游行政部门初审推荐、专家组资料审核、现场检查等综合评审,全省共有5个县(市、区)入选名单,赤城……绝了,切尔西提供2500万年薪,邀请齐达内执教,齐祖欧冠资格我的生活也是头条据西班牙知名媒体《dondiario》爆料称,切尔西的成绩实在太糟糕,他们准备提供一份2500万欧元的年薪邀请传奇巨星齐达内来执教,如果齐祖同意的话,那么……长城脚下的老厂房,尽显北方乡村之美瓦厂酒店位于慕田峪长城脚下,群山环绕,风景秀美,多元化的世界与当地民俗相映成趣。住在这里,每天出门,抬头就能看到箭扣长城。民宿:瓦厂酒店位置:怀柔区渤海镇北沟村……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网