应用办公生活信息教育商业
投稿投诉
商业财经
汽车智能
教育国际
房产环球
信息数码
热点科技
生活手机
晨报新闻
办公软件
科学动态
应用生物
体育时事

AI课堂第12讲DL深度学习模型正向传播反向传播计算图

  在前面几节课的代码演示中,我们都是先通过模型的正向传播(forwardpropagation)对输入计算模型输出,利用损失函数得出预测值和真实值的损失值,然后使用反向传播算法(backpropagation)快速计算目标函数关于各个参数的梯度,最后使用随机梯度下降算法(StochasticGradientDescent,SGD)基于前面得到的梯度值计算loss函数局部最小值,从而求解权重并更新网络参数。
  模型训练关键步骤
  基于反向传播算法(backpropagation)的动求梯度极简化了深度学习模型训练算法的实现。
  这节我们将使数学和计算图(computationalgraph)两个式来描述正向传播和反向传播。具体地,我们将以带L2范数正则化的单隐藏层感知机为样例模型解释正向传播和反向传播。
  1。正向传播
  正向传播是指对神经络沿着从输层到输出层的顺序,依次计算并存储模型的中间变量(包括输出)。为简单起,假设输是个特征为xRd的样本,且不考虑偏差项,那么中间变量
  网络计算的中间变量
  其中W(1)Rhd是隐藏层的权重参数。把中间变量zRh输按元素操作的激活函数后,
  我们将得到向量度为h的隐藏层变量
  h(z)。
  隐藏变量h也是个中间变量。假设输出层参数只有权重W(2)Rqh,我们可以得到向量度
  为q的输出层变量
  oW(2)h。
  假设损失函数为,且样本标签为y,我们可以计算出单个数据样本的损失项
  L(o,y)
  根据L2范数正则化的定义,给定超参数,正则化项即
  正则化惩罚项
  其中矩阵的Frobenius范数等价于将矩阵变平为向量后计算L2范数。最终,模型在给定的数据
  样本上带正则化的损失为
  JLs。
  我们将J称为有关给定数据样本的标函数,并在以下的讨论中简称标函数。
  2。正向传播的计算图
  通常绘制计算图来可视化运算符和变量在计算中的依赖关系,一般来说,计算图中左下角是输入,右上角是输出。其中方框代表变量,圆圈代表运算符,箭头表示从输入到输出之间的依赖关系。
  正向传播的计算图
  3。反向传播
  反向传播指的是计算神经网络参数梯度的方法。总的来说,反向传播依据微积分中的链式法则,沿着从输出层到输入层的顺序,依次计算并存储目标函数有关神经网络各层的中间变量以及参数的梯度。对输入或输出X,Y,Z为任意形状张量的函数Yf(X)和Zg(Y),通过链式法则,有:
  链式法则求导
  其中prod运算将根据两个输入的形状,在必要的操作(如转置和互换输入位置)后对两个输入做乘法。
  例中的模型,它的参数是W(1)和W(2),因此反向传播的目标是计算目标函数对参数的导数JW(1)和JW(2)。
  应用链式法则则依次计算各中间变量和参数的梯度,其计算次序与前向传播中相应中间变量的计算次序恰恰相反。
  首先,分别计算目标函数JLs有关损失项L和正则项s的梯度:
  其次,依据链式法则计算目标函数有关输出层变量的梯度JoRq:
  接下来,计算正则项有关两个参数的梯度:
  现在,我们可计算最靠近输出层的模型参数的梯度JW(2)Rqh。依据链式法则,得到:
  沿着输出层向隐藏层继续反向传播,隐藏层变量的梯度JhRh计算如下:
  由于激活函数是按元素运算的,中间变量z的梯度JzRh的计算需要使用按元素乘法符:
  最终,可以得到最靠近输入层的模型参数的梯度JW(1)Rhd。依据链式法则,得到:
  4。正向传播和反向传播的训练关系
  在训练深度学习模型时,正向传播和反向传播之间相互依赖。
  一方面,正向传播的计算可能依赖于模型参数的当前值。而这些模型参数是在反向传播的梯度计算后通过优化算法迭代的。
  例如,计算正则化项
  依赖模型参数W(1)和W(2)的当前值。而这些当前值是优化算法最近次根据反向传播算出梯度后迭代得到的。
  另一方面,反向传播的梯度计算可能依赖于各变量的当前值。而这些变量的当前值是通过正向传播计算得到的。举例来说,参数梯度JW(2)(Jo)hTW(2)的计算需要依赖隐藏层变量的当前值h。这个当前值是通过从输层到输出层的正向传播计算并存储得到的。
  因此,在模型参数初始化完成后,我们交替地进正向传播和反向传播,并根据反向传播计算的梯度迭代模型参数。既然我们在反向传播中使了正向传播中计算得到的中间变量来避免重复计算,那么这个重也导致正向传播结束后不能即释放中间变量内存。这也是训练要预测占更多内存的个重要原因。另外需要指出的是,这些中间变量的个数跟络层数线性相关,每个变量的小跟批量小和输个数也是线性相关的,它们是导致较深的神经络使较批量训练时更容易超内存的主要原因。
  总结
  正向传播沿着从输层到输出层的顺序,依次计算并存储神经络的中间变量。
  反向传播沿着从输出层到输层的顺序,依次计算并存储神经络中间变量和参数的梯度。
  所谓反向传播,传播的是损失,也就是根据最后的损失,计算网络中每一个节点的梯度,这里利用了链式法则,使得梯度的计算并不是很复杂。
  在训练深度学习模型时,正向传播和反向传播相互依赖。

喝酒时,不要和碳酸饮料勾兑着喝,否则百害而无一利市面上卖的酒大体上分为白酒、红酒和啤酒,每一种酒所含有的酒精含量也各不相同。白酒有生热抗寒的功效,很多人喜欢在冬日喝它。但是喝多了会导致胃粘膜出血,发生酒精中毒,甚至是心脑血管……我命由我不由天!NBA中那些逆袭的球员NBA选秀中的低顺位,仿佛注定是联盟中的匆匆过客,不会留下任何痕迹。但有一类球员,他们本着我命由我不由天的气势。通过自身的努力,最终逆袭。本期就给大家盘点一下这些低顺位出生的球……如果不差钱,春天给小孩做这2道长高菜,孩子个子高发育快春季到来,是小孩子发育最好的时间,研究显示,春季小孩的发育速度是秋季的22。5倍,所以许多母亲也是想抓住这个机会让孩子长的更好些。今天我给大家分享2道美食,如果你有时间,又不差……生男还是生女,都是由这4个指标决定的从遗传学的角度来说,生男生女全靠男性xy染色体来决定,所以妈妈们要记住了,备孕不是一个人的事情,孩子性别健康,责任在爸爸身上。男人不自爱,就像烂白菜,备孕也是,准爸爸的几……我的思绪缥缈我的思绪缥缈(原创黑珊瑚220629)我不用努力就能想到你的好可以多年少才能不计后果只想执手偕老我没有计划逃跑只是陷进了你的微笑……21!英超奇葩一幕22岁天才949天首球,孙兴慜维持神迹导读:英超联赛正式开启,这无疑是顺遂了球迷想要一睹高质量足球比赛的心理。今夏,随着哈兰德以及努涅斯登陆英超,再加上凯恩、孙兴慜、萨拉赫等人仍旧活跃在一线,进攻大戏将更加激烈,而……2021年发生了哪些灾难?沙漠大水,河南暴雨,霍金预言将成真笔者:杰鲁鲁如果我说,2021年发生的诸多灾难,比过去二十年都多,可能会有很多人不相信,但大伙看完我的陈述之后,你们就会发现,原来过去的一年里,地球竟然遭遇了如此多的磨难……在单支球队度过最多赛季的现役NBA全明星这是真正的忠诚度随着凯文杜兰特的转会请求震动了整个NBA,其中一个副作用是开始了另一场关于NBA忠诚度的话题。忠于球队的典型代表达米安利拉德(DamianLillard)谈到了联盟在这方面的变……晒干豆角,直接放太阳下晒不好吃容易坏,牢记2点,香味浓耐保存夏天光照时间长,温度高,雨水多,是植物们都非常喜欢的季节,仿佛有着吸收不完的阳光雨露,可以自由生长。所以夏天是四季中食材最为丰富的时候,这个季节的蔬菜新鲜又便宜。中国人一种有着……夏日宜吃苦苦瓜会导致骨质疏松?民间有夏天吃苦,胜似进补的说法。带有苦味的食物被不少人视作是凉性食物,认为食用凉性食物可以清热泻火、消暑提神。在众多苦味食品中,苦瓜一直备受青睐。民间流传着很多关于苦瓜功……谷雨前后一定要吃的食物和养生食方适合谷雨这个节气前后吃的食材有:香椿、香蕉、芒果、佛手、马兰头、玫瑰花、蚕豆、红豆、黄瓜、马齿苋、冬瓜、蕨菜、绿茶、菊花、木瓜。养生食方:薏米红豆粥食材:薏米……弟子复制夺金一刻,赵宏博赛前给葱桶做足了预案隋文静赛后与教练团队庆祝。新京报记者陶冉摄新京报讯(首席记者孙海光)12年前的温哥华,申雪赵宏博拿下中国首枚双人滑冬奥会金牌。12年后,葱桶组合隋文静韩聪复制了这一壮举。……
王祖贤为什么退出娱乐圈了?王祖贤为什么退出娱乐圈了?王祖贤退出娱乐圈主要有两方面原因,一个原因是被情所伤;另外一个原因是王祖贤的性格比较随性洒脱,想过闲云野鹤的生活!王祖贤简介1967年,王……如何推动青年人就业?人社部答红星新闻简化就业手续,延长落户办今年青年失业率一直居高不下,同时高校毕业生人数再创新高。那么,人社部在推动高校毕业生等青年人就业方面做了哪些工作?下一步会有哪些安排和部署?8月25日,中宣部召开中国这十……经常嗳气怎么办?找准原因再治疗嗳气俗称打饱嗝,是充盈于胃内的气体由于胃逆蠕动、贲门开放,突然经口排出所致,为消化系统常见的症状之一。嗳气常源于进食产气食物或者吞气症(无意识的吞咽空气),也可因消化道病……2011年,侯耀文骨灰安放仪式2011年春天,在骨灰墙上安放了长达45个月的侯耀文的骨灰终于得以入土。当天上午十点安葬仪式在昌平的一座陵园举行。在听到这个消息之后,不少曾经深深为侯耀文的艺术魅力而吸引的朋友……ampampquot情感导师ampampquot涂磊本该前途屡出金句的情感导师涂磊曾言:温柔的拒绝远胜于严厉的苛责。意思是在不违背自身意愿的情况下,尽可能用婉转的语气,诚恳地给出建议使人信服。但在某次带货直播中,涂磊的所作所……philink斐讯运动复活攻略philink斐讯运动是一款运动软件,软件跟斐讯穿戴设备一起使用,通过两者结合,可以检测到身体健康数据,例如睡眠时间是多久、心率等等,而且还能检测到用户们每天的运动轨迹,能给用……雅尼斯新消息!大概率留在CBA或将重新证明自己北京时间4月8日,在北京首钢惨被吉林男篮之后,北京首钢完成了季后赛一轮游!赛后,雅尼斯主动承担了输球的责任,成为了背锅侠,火速宣告辞职!尽管雅尼斯在执教北京首钢过程中,带队成绩……赵丽颖冯绍峰离婚早有预兆,对方婚后死性不改,彻底看清渣男本质赵丽颖嫁给冯绍峰之前是笑容满面,像一朵小花,但是嫁给冯绍峰之后他却是发生了很大的改变,表情冷漠,没有笑容,赵丽颖在那几年里到底经历了什么?赵丽颖和冯绍峰结婚是被网友不被看……326783!利拉德真被打哭了,天知道他失去了什么马刺103113鹈鹕马达,你知道最后4分多钟的时候,本宫有多紧张吗?生怕被逆转了,这特么被逆转了我的文章可怎么办啊!!!鹈鹕啊!还真不愧是鹈鹕!不得不说今天鹈……十四五期间培育1000家国家级生态农场!浅析生态农场的落地可乡村旅游业的蓬勃发展,使得相关行业成为当地新的经济增长点,而为了避免发展同质化的问题,集观光旅游、有机农业等功能为一体的生态农场,逐渐成为了众多企业和创业者的发展目标。2022……电子烟出海大潮从制造出口到品牌出口,行业已现两极分化电子烟。图ICphoto海外市场现在呈蓝海趋势,公司未来方向肯定会向海外偏移。7月11日,在国内经营着一家电子烟品牌的张雷告诉新京报贝壳财经记者,一年前,自觉国内机会不大……神秘可爱的中亚大国哈萨克斯坦风景治愈哈萨克斯坦是横跨亚欧两洲的国家,国土包括中亚北部和东欧的东南部,国土面积相当庞大,位居世界第九位。境内四季均有郁金香开放,因此郁金香是他们的国花,首都为阿斯……
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网