变分自编码器VAE的数学原理
变分自编码器(VAE)是一种应用广泛的无监督学习方法,它的应用包括图像生成、表示学习和降维等。虽然在网络架构上经常与AutoEncoder联系在一起,但VAE的理论基础和数学公式是截然不同的。本文将讨论是什么让VAE如此不同,并解释VAE如何连接变分方法和自编码器。
本文更专注于VAE的统计概念和推导。我们将从介绍VAE所要解决的问题开始,解释变分方法在解决方案中所起的作用,并讨论VAE与AE之间的联系。最后还会将VAE应用于图像重建任务来进行具体的演示。
我们考虑一个由随机变量x的N个i。i。d。样本(标量或向量)组成的数据集。假设数据是由一些随机过程产生的,这里包含一个未观察到的随机变量z(即潜在变量)。
生成过程有两个步骤:
值z是从某个先验分布p(z;)生成的,值是从一些依赖于的条件分布p(xz;)生成的,
其中先验p(z;)和条件似然p(xz;)都是未知参数集的参数分布。
我们感兴趣的是与给定场景相关的以下三个问题:参数集的MAPML估计,使用它可以模拟上述生成过程并创建人工数据。对于参数的选择,给定观测值x,隐变量z的后验推断,即p(zx;),这对表示学习很有用。对于参数的选择,变量x的边际推断,即p(x;),这在需要先验x的情况下是有用的。变分法
变分法是解决上一节提出的三个问题的关键。让我们从后验推理开始,即计算p(zx;)。我们可以通过应用贝叶斯定理和概率链式法则写出后验概率:
假设我们可以选择参数,因此先验分布p(z;)和似然p(z;)由生成过程定义的值是已知的。所以理论上后验p(z;)可以在计算分母中的积分后计算出来,这涉及到枚举不可观测变量z可能具有的所有可能值。
但是如果没有对p(z;)或p(z;)的任何简化假设,积分是难以处理的,这意味着任何用于评估积分的方法(包括枚举运算)的计算复杂度都是指数级的。
变分法就是为这种情况而设计的,它允许我们通过将统计推理问题转化为优化问题来避免棘手的积分问题。变分法提出了一个识别模型q(z;)作为真实后验p(z;)的近似值。通过最小化q(z;)和p(z;)之间的KL散度,我们可以解决后验推理问题。为了简化计算,这里将对识别模型和生成模型的参数和进行联合优化。
让我们对KL散度做进一步的推导,为简单起见,参数和将被省略。
logp(x)是一个常数,所以在优化过程中可以忽略。我们还要重写ELBO:
优化问题现在等价于:
算法学习的过程
借助变分法可以避免复杂的积分,而下一个挑战是对给定的优化问题使用什么算法。如果能够解决这个问题那么上面提到的三个问题就都不是问题了。
就像其他深度学习模型一样,我们使用随机梯度下降进行优化,将要最大化的优化目标(即ELBO)重写为要最小化的损失函数的形式:
这里原始期望项使用蒙特卡洛方法进行近似,即对从q(zx;)中提取的L个样本z求平均logp(xz;)。给定可微损失函数,VAE的完整学习算法如下:得到由M个数据点组成的小批量;计算小批量损失(,,x)M;计算梯度(,,x)M;应用梯度来更新参数和;重复前4个步骤直到收敛。
在实际应用中,样本z不是直接从q(z;)中抽取的,因为q可以是任意复杂的分布并且难以采样。为了提高采样效率,可以通过设置g(,;),其中g(,;)可以是任何以噪声,而是神经网络的输入。噪声是从一些简单分布p()中采样的(例如高斯分布)。
除了采样效率之外,重新参数化技巧的另一个优点是它允许对和进行更好和更全面的优化。假设我们直接从q(z;)中抽取样本,损失中MC估计项的梯度只会反向传播到采样的潜在变量z,它的梯度w。r。t不会被计算,所以参数只能通过损失中的KL散度项来优化,这对于学习稳定性来说可能不是最优的。VAEvs。AE
我们对VAE和AE进行比较,这样可以帮助我们从自编码理论的角度更好地理解VAE。
在自编码器的世界中,编码器f(x)处理数据点,然后生成z。解码器g(z)将z作为输入,并重建的x。自动编码器一般都是在重建损失(),平方误差,xx下学习。
对于VAE,未观察到的变量z可以解释为分布编码。识别模型q(zx;)可以被视为概率编码器,因为给定数据点x它会产生z的可能值的分布,而p(xz;)可以看作一个概率解码器:给定一个编码z,它产生x的可能对应值的分布。
VAE损失函数中的MC估计项恰好是负对数似然的形式,因此可以作为重建损失,损失函数中还包含一个KL散度项,它充当正则化项并强制分布q(zx;)接近先验p(z;)。
所以VAE可以看作是AE的概率版本,它们都是表示学习的有用工具。而VAE相对于AE的优势在于它明确地模拟了生成过程,并且能够通过从p(xz;)中采样来生成类似于真实数据的人工数据点。更重要的是VAE学习的分布在统计分析中非常有用。使用MNIST的演示VAE
在所有的理论解释之后,我们使用MNIST图像重建任务的演示VAE。VAE模型的结构如下:
高斯编码器:由于其稳定的静态特性和简单的采样,我们选择多元高斯作为编码器输出分布,其中的均值和方差值由前馈网络建模。
伯努利解码器:MNIST数据是灰度图像,其中每个像素都可以表示为0到1之间的一个浮点数,因此伯努利分布是我们解码器的首选。F是元素级sigmoid激活函数,公式如下:
损失函数:为简单起见,我们将先验p(z)设置为正态分布(0,I)。概率编码器的分布是(;,),其中,和,分别是均值向量的第j个分量。KL散度项为:
对于期望项,我们设置样本数L1并使用MC估计logp(xz)来代替原始期望项,其中代码z通过重新参数化技巧进行采样。也就是说z,噪声从正态分布中采样(0,I),,是编码器中的均值向量。
结合KL和MC估计项可以得到完整的损失函数(负ELBO):
这是概率解码器p(xz;)生成的手写数字图像的有趣可视化。
总结
总最后总结本文的关键要点:VAE用于解决3个统计问题,分别是参数估计、后验推断和边缘分布推断。通过使用变分方法,可以构造一个损失函数为负ELBO的参数优化问题,通过重新参数化技巧和随机梯度下降算法来解决VAE的统计问题。变分法引入的识别模型q(zx;)和预定义的生成模型p(xz;)分别对应概率编码器和解码器,而损失函数可以解释为组合重建损失以及正则项。
以上就是本文的所有内容
作者:JZ
多地上空出现不明飞行物,真的有外星人存在吗?12月19日晚,内蒙古呼和浩特、鄂尔多斯、包头、黑龙江、天津等多地网友拍摄到有巨大发光物体出现在天空之上,这些发光物体皆有着显著的特征。那就是其尾巴部分如同伞状,并且随着时间的……
我国癌症高发,是否和鸡肉有关呢?研究结果公布,转给家人看看吧俗话说无鸡不成宴,作为一位肉食主义者,想打造一场鸡肉的盛宴,摆在眼前的第一道难题,是如何挑选新鲜的鸡肉。鸡肉,顾名思义指鸡身上的肉。相比于其他肉类,鸡肉质细嫩,鲜美可口,……
男科肾精亏虚,感觉身体被掏空怎么办?中医一方搞定首先,我们来看看肾虚有哪些表现:肾虚通常表现为失眠、腰疼、畏寒、发热。有过度的疲劳紧张、某些内分泌代谢失调、特殊感染等,导致机体正常的调节能力降低。功能、精力……
卿卿日常郝葭被尹嵩虐待,李薇自请尹峥写休书,尹峥休想白敬亭主演的电视剧《卿卿日常》越来越精彩了,新的剧情中李薇、元英、董海棠以及节气姑娘们成功的克服困难,开上了酒楼。结果尹岸又带着官兵来搞事,被李薇等吓走后他居然在酒楼对面开起了……
世界杯最新形势3队出线2队出局,阿根廷起死回生,亚洲之光熄灭世界杯小组赛第二轮比赛已经全部结束,关于出线权的争夺也初现端倪。在本轮过后,共有3支球队成功突围,率先杀进了16强,而与之相对应的,也有2支球队遭到了淘汰,提前宣告与世界杯冠军……
大大方方性教育图郑州廖博文时兆娟家有女儿,怎样进行性教育,特别是个大问题。生于七十年代的我,在性教育方面一片空白。记得《生理卫生》课本发下来,大家都偷偷翻开看生殖与健康一章……
泰国特色服务,清一色小姐姐,手法专业走心不知什么时候开始刮起了一股去泰国旅游观光的热潮,可能有部分小伙伴觉得泰国属于东南亚地区的国家。(此处已添加小程序,请到今日头条客户端查看)不仅拥有众多的风土人情,景点特色……
合理利用时间刚刚梳头时想到的,我在盘算着要做什么,突然就想写这个。当还有一个小时就到自己的常规入睡时间的时候,大多数人会无所事事,想着还有一个小时就要睡觉了。就百无聊赖地刷刷视频到处晃荡晃……
如何学习kafka?作者:sinxu,腾讯CSIG后台开发本文主要从Kafka消费、堆积、稳定性、预案、成本控制等角度等最佳实践。引言:要确保Kafka在使用过程中的稳定性,需要……
苹果撤出俄市场后,俄罗斯人等4个月买水货iPhone14正观新闻综合报道据路透社消息,尽管苹果公司宣布从3月份开始全面停止在俄罗斯销售其产品,但该国的一些零售商仍在出售剩余库存,有些人还通过平行进口途径购买最新苹果产品。平行进……
这个周末必打卡,重现当年英勇抗击日寇的壮举,激发爱国情衡阳保卫战纪念馆位于衡阳市高新技术产业开发区新桥管理处第七组。景区内主要建筑系清代记名提督、振威将军陆成祖(18381891年)于光绪七年(1881年1887年)建造,距今已有……
江苏交通基础设施建设持续提速前三季度全省公铁水空完成投资超1今年以来,江苏全力推进交通基础设施建设,前三季度,全省公铁水空基础设施建设累计完成投资超过1400亿元,为巩固经济、恢复基础、增强发展后劲提供了有力支撑。9月28日,作为……
12月份Switch上有什么新产品值得一玩?我给大家推荐六款时间过得很快,如今已经来到2021年的最后一个月了。稍早,博士和大家分享了文章《12月份有什么新产品值得期待?我给大家推荐七款游戏》,介绍的产品大多都是PC、PS4、XbosO……
漫步平遥古城文臧登华平遥,一直以来是我心怡神往的旅游规划中的一个重要景点。向往她,不仅仅是因为她被列为世界文化遗产,也不仅仅是中国银行业的鼻祖日升昌记诞生于此,也不仅仅是看那固若金汤……
拍Vlog必备神器极致防抖能力,智云云鹤M3了解一下近几年Vlog是真的火,不论是专业玩家还是普通小白,只要是对拍视频感兴趣的,基本上都会选择自己创作属于自己的Vlog。不过,虽然目前的相机在拍摄视频的造诣已经很不错了,但拍摄V……
警惕!当代孩子的三大社交货币奥特曼叶罗丽小伶玩具我女儿有一天大半夜做噩梦:使劲喊叫,双腿乱蹬。我怎么叫都叫不醒,无奈哄了半天,她才再次睡过去。直到第二天,我才迫不及待地问她,昨晚做了什么梦。她说她做了一个大……
身体有这8大状况,说明你特别健康来源:晚读书房(ID:DC001234)长命百岁是每一个人的愿望,虽然并非人人可以实现,但即使不能长寿,也是要健健康康的,对吧!随着生活水平的提高,加上人们对养生的……
中国篮球氛围这么好,还能出第二个姚明吗?进NBA这么难吗?虽然国内篮球氛围很好,但大部分比赛都是商业利益,真正热爱篮球的人很少,接受过专业训练的人就更少了,除了少数专业学校,大部分学校只教授篮球的一些基本技术,根本没有正式的训练。天赋……
芳华商店下周关闭,兑换特效宝箱不浪费,圣诞史诗标配回城来袭限时开启21天的芳华币商店将在下周三(15号)关闭,因为全服占点任务已经结束,玩家即便还有芳华礼盒剩余,也无法再提交礼盒兑换成芳华币。虽说不能使用礼盒有些可惜,但剩余的芳华币也……
再见美羊羊!被剥夺队长袖标后,离开阿森纳倒计时,或将加盟巴萨众所周知,因为违反了纪律的问题,奥巴梅杨被阿森纳给剥夺了队长袖标,可以说,现在球员和俱乐部之间,已经处于关系破裂的状态!也就是说,最快1月份冬窗打开的时候,美羊羊就会推动自己转……
限时返场丨超多经典套装限时返场!风格各异等你挑选各种不同风格的套装限时返场咯!不管你喜欢的是俏皮可爱型还是帅气迷人型,这次通通满足你!心动的特种兵快行动起来吧蔚蓝诱惑蔚蓝大海,清凉一夏深海曼妙深层战术,优雅……
双奥之城梦想渐成真相约北京期盼冬奥2021年,随着北京2022冬奥会倒计时的秒针转动,北京将成为世界首个双奥之城的梦想逐渐成真。这一年,除了日常的摄影采访任务,大量的是拍摄与北京冬奥……
垃圾水手游戏(附加攻略)垃圾水手是一款手绘风合作航海冒险游戏,游戏有着和饥荒类似的荒诞画风,画面独特、创意十足,为玩家带来良好的视觉效果。游戏中玩家将扮演末日新幸存者,在被大洪水毁灭后的世界航行,世界……
冬天喝汤能大补?医生提醒小心身体受不了俗话说,冬季进补,春天打虎!进入冬天后,很多人喜欢通过食补的方式来补身体,尤其是煲汤。因为民间都说喝汤能大补,比吃肉更有营养,咱们很多肾病患者也是这样认为的。有些肾……