验证性因子分析(什么数据适合因子分析)
验证性因子分析(什么数据适合因子分析)创2021060911:07Codewar快一个月没更新文章啦,今天收到好几个粉丝的催更私信,好的吧,实在对不住大家期待的眼神,看样子不能再拖啦,想想写啥好呢,大家咨询比较多的,混合模型算一个,今天就继续给大家写写混合模型如何做吧。
混合模型一般都可以用lme4这个包解决,lme4既可以做线性混合模型,也可以做广义线性混合模型还可以做非线性混合模型,大家有需要可以只研究这一个包就行。
所谓混合模型就是既有固定效应又有随机效应的模型:
mixedeffects,denotesamodelthatincorporatesbothfixedandrandomeffectstermsinalinearpredictorexpressionfromwhichtheconditionalmeanoftheresponsecanbeevaluated第一部分线性混合模型
直接上例子,数据是来自一篇研究睡眠剥夺的文献,整个数据大概长下图这样,其中我们的受试者在day0的时候可以睡到自然醒,在之后的日子里所有的受试者就只能睡3个小时了,我们的响应变量是Reaction,就是对受试者做的测验的响应时间,我现在关心睡眠剥夺后,响应时间的变化情况:
对于这么一个纵向数据,
我们来捋一捋:我们只有18个人受试者,每个受试者随访10次,我们需要明白的是,此时我们的每一次测量是嵌套在人的水平上的,我们可以认为,不同人自己的10次测量是有强烈的相关性的,而不同人之间的这种关系又不一定是相同的。
直观一点,我们可以画出来每一天所有人响应时间和睡眠剥夺的变化,画出来就是下图:
可以看到我们上面的这个大图是由很多个小图组成的,每一个小图中横轴就是睡眠剥夺的时间,纵轴是反应时间。每个小图就代表着我们要研究的睡眠剥夺和反应时间的关系(具体到人),但是我们也应该注意到这种关系在不同的人上是不同的,体现在:关系的斜率不同和截距不同。(这个关系的不同可以很明显的在图中看出来)
所以我们就可以拟合一个带有随机效应的混合模型:fm1lt;lmer(ReactionDays(DaysSubject),sleepstudy)
运行代码后得到下面的结果:
结果中有随机效应的标准差和固定效应的估计,我得到的截距是251。4,斜率是10。5,这两个系数就是我们研究的总体关系的表示,通常需要在文献中汇报,就意味着睡眠不剥夺的时候人的反应时间是251。4,而睡眠每剥夺多一天反应时间增长10。5。
上面这个是最简单的混合模型。我们继续看:lme4包高水平设置介绍
混合模型公式
对于一个常见的混合模型,我们可以在lme4包中写出来如下差不多的混合模型公式:respFEexpr(REexpr1factor1)(REexpr2factor2)。。。
这个公式中FEexpr就是固定效应,(REexpr1factor1)and(REexpr2factor2)都是随机效应,理论上你可以弄很多个随机效应但是实际操作中我们不会关心那么多。
理解混合模型公式
我们看到每一个随机效应在公式中的表达都是(exprfactor)这样的。竖杠前面的expr就是一个常规的回归公式,竖杠后面的factor就是一个常规的因子,你可以把竖杠想象成回归公式和因子的交互:
Onewaytothinkabouttheverticalbaroperatorisasaspecialkindofinteractionbetweenthemodelmatrixandthegroupingfactor。Thisinteractionensuresthatthecolumnsofthemodelmatrixhavedifferenteffectsforeachlevelofthegroupingfactor。
这种交互的意思就是在因子的不同水平,我们的回归是不一样的,这也正好和我们前面的解释相对应,就是在不同的人的水平睡眠剥夺和响应时间的关系不一样。
写到这,希望大家能记住下面这张表:
这个表就给我们展示了常见的随机效应的设置,比如(1g),就是说在因子g的不同水平,我们响应变量的截距都不一样。表中的第二行有个offset,表示没有固定效应。如果我们的数据是一个三层嵌套数据,我们可以用第三行的设定来表示随机截距;如果你的数据没有直接嵌套但是在g1和g2的不同水平上存在相关,那么可以用第四行的设定,这个在项目反应理论中比较常见。
在lme4中,默认认为同一个模型的截距和斜率是存在相关的,如果你确定截距和斜率无关那么设定随机效应的时候就可以用两个竖杠,或者把截距和斜率分开来写,就是说(xg)和x(1g)(0xg)表达的随机效应都是一样的。
比如如果我认为睡眠剥夺和反应时间随机效应的截距和斜率无关,我便可以做如下设定:fm2lt;lmer(ReactionDays(DaysSubject),sleepstudy)截距和斜率无关的设定
有时候我们拟合一个后又想尝试对模型进行改变,但又不想重写,此时就可以直接对相似的模型基础上进行更新:
模型的更新
比如我想在fm1的基础上去掉随机斜率只留随机截距,我就可以用updata写出如下代码:fm3lt;update(fm1,。。(DaysSubject)(1Subject))模型的更新
到底哪一个模型更好呢?
可以用anova方法进行模型间的比较:anova(fm1,fm2,fm3)
运行代码会输出比较的结果:
其中,从模型比较的结果可以看出,给模型增加一个截距和斜率无关的随机效应相比会使得模型的deviance变小,进一步将随机效应设定为相关,并不能够显著地减小deviance,从而我们就可以知道fm2才是对数据拟合最好的模型。第二部分非线性混合模型
非线性混合模型就是通过一个连接函数将线性模型进行拓展,并且同时再考虑随机效应的模型。
Thefixedeffectsparametersdescribethegeneralpatternsofthedataandrandomeffectsparametersdescribespecificclusters。Ifthemodelisnonlinearintheparameters,itiscalledanonlinearmixedeffectsmodel(Davidianamp;Giltinan,2003)
非线性混合模型常常在生物制药领域的分析中会用到,因为很多剂量反应并不是线性的,如果这个时候数据再有嵌套结构,那么就需要考虑非线性混合模型了。
看下面这个图,这个图描绘了不同人用了茶碱过后的反应,时间是横轴,残留是纵轴,和开篇线性模型中睡眠剥夺和反应时间的例子一样,我们把每个人的关系都做了图出来,不过从图中可以明显看出这种关系并不是简单线性的。
其实这种不是线性的关系存在的情况很多。
比如渐进回归:
再比如逻辑增长:
此时我们要注意到像这两非线性关系模型的参数都不是简单的一个斜率加个截距了。都有1,2,3三个额外参数。
这儿先给大家写一个逻辑增长的实际例子:我现在有一个关于树木周径的数据集,每棵树随访了7次,每次随访记录数的年龄age,和周径,我现在想研究在所有树木中时间和周径的关系。
很自然,我们可以想到不同的树这个关系应该是不一样的,我们想探求的一定是考虑了树水平的变异之后的总体关系,所以不妨先画出来每个树的关系:
从图中可以看到我们总共有5棵树,基本关系是一致的,但存在些许变异相关(所以考虑混合模型),而且这个关系并不是线性的(时间越大周径基本不改变了),所以我们应该考虑非线性的混合模型。
具体地,我们可以用nlmer方法来拟合非线性混合模型,方法参数包括3部分:首先是响应变量,然后是非线性函数,然后是混合效应公式:
Theformulaargumentfornlmerisinthreeparts:theresponse,thenonlinearmodelfunctiondependingoncovariatesandasetofnonlinearmodel(nm)parameters,andthemixedeffectsformula。
比如对我们的数据我就可以写出如下SSlogis方法的代码:print(nm1lt;nlmer(circumferenceSSlogis(age,Asym,xmid,scal)AsymTree,Orange,startc(Asym200,xmid770,scal120)),corrFALSE)
此时我们选择的非线性函数是逻辑增长函数SSlogis,刚刚给大家解释了这个函数是有3个参数的,在上面的代码中,age是我们的预测变量,Asym,xmid,scal分别是额外的三个参数(之前的逻辑增长的式子和Asym(1exp((xmidinput)scal))等同):
进一步,拟合逻辑增长是要我们给出这些参数的初始值的,然后从初始值通过梯度下降寻找各个参数的最优解:
SSlogishasanattributecalledinitial,whichisafunctionthatnlscancalltocomputereasonablestartingvaluesforfittingalogisticfunctiontotheinputdata。
所以我们看到代码中都给出了响应参数的初始值。
运行上面代码后输出如下结果:
我们可以看到结果中的固定效应里面有Asym,Xmid,scal参数的估计结果。
那么这些参数如何解释呢?
留个悬念我们下期再更。关注关注关注,嘿嘿。小结
很久没更新了,今天给大家写了如何用lme4做混合模型,包括线性和非线性的例子,感谢大家耐心看完,自己的文章都写的很细,代码都在原文中,希望大家都可以自己做一做,请关注后私信回复数据链接获取所有数据和本人收集的学习资料。如果对您有用请先收藏,再点赞转发。
也欢迎大家的意见和建议,大家想了解什么统计方法都可以在文章下留言,说不定我看见了就会给你写教程哦,另咨询代做请私信。
如果你是一个大学本科生或研究生,如果你正在因为你的统计作业、数据分析、论文、报告、考试等发愁,如果你在使用SPSS,R,Python,Mplus,Excel中遇到任何问题,都可以联系我。因为我可以给您提供好的,详细和耐心的数据分析服务。
如果你对Z检验,t检验,方差分析,多元方差分析,回归,卡方检验,相关,多水平模型,结构方程模型,中介调节,量表信效度等等统计技巧有任何问题,请私信我,获取详细和耐心的指导。
IfyouareastudentandyouareworriedaboutyoustatisticalAssignments,DataAnalysis,Thesis,reports,composing,Quizzes,Exams。。AndifyouarefacingprobleminSPSS,RProgramming,Excel,Mplus,thencontactme。BecauseIcouldprovideyouthebestservicesforyourDataAnalysis。
AreyouconfusedwithstatisticalTechniqueslikeztest,ttest,ANOVA,MANOVA,Regression,LogisticRegression,ChiSquare,Correlation,Association,SEM,multilevelmodel,mediationandmoderationetc。foryourDataAnalysis。。。??
ThenContactMe。IwillsolveyourProblem。。。往期精彩
R数据分析:有调节的中介
R数据分析:用R语言做meta分析
R数据分析:用R语言做潜类别分析LCA
R数据分析:多分类逻辑回归
R数据分析:如何做聚类分析,实操解析
R数据分析:主成分分析及可视化
R数据分析:混合效应模型实例
R数据分析:生存分析的做法与解释续
R数据分析:如何做潜在剖面分析Mplus
R数据分析:中介作用与调节作用的分析与解释
R数据分析:生存分析的做法和结果解释
R数据分析:潜在剖面分析LPA的做法与解释
R数据分析:逐步回归的做法和原理,案例剖析
R数据分析:著名的三门问题的R语言模拟
R数据分析:潜变量与降维方法(主成分分析与因子分析)
R数据分析:双分类变量的交互作用作图
R数据分析:倾向性评分匹配实例操作
R数据分析:ROC曲线与模型评价实例
R数据分析:如何用R语言做meta分析,写给小白
R数据分析:多水平模型详细说明
R数据分析:如何用R做验证性因子分析及画图,实例操练
R数据分析:多元逻辑斯蒂回归的做法
R数据分析:嵌套数据分析为什么要用加随机效应?终于解释清楚了
R数据分析:交叉滞后模型非专业解释
R数据分析:再写潜在类别分析LCA的做法与解释
R数据分析:如何绘制回归分析结果的森林图
R数据分析:倾向性评分匹配完整实例(R实现)
R数据分析:手把手教你画列线图(Nomogram)及解读结果
R数据分析:混合效应模型的可视化解释,再不懂就真没办法
R数据分析:广义估计方程式GEE的做法和解释
R数据分析:tableone包的详细使用介绍
数码知识oppor15x有几个颜色哪个颜色好看如今使用IT数码设备的小伙伴们是越来越多了,那么IT数码设备当中是有很多小技巧的,这些技巧很多小伙伴一般都是不知道如何来实用的,就好比最近就有很多小伙伴们想要知道oppor15x有
数码知识三星a80有几个颜色哪个颜色好看如今使用IT数码设备的小伙伴们是越来越多了,那么IT数码设备当中是有很多小技巧的,这些技巧很多小伙伴一般都是不知道如何来实用的,就好比最近就有很多小伙伴们想要知道三星a80有几个颜
数码知识红米k20有几个颜色哪个颜色好看如今使用IT数码设备的小伙伴们是越来越多了,那么IT数码设备当中是有很多小技巧的,这些技巧很多小伙伴一般都是不知道如何来实用的,就好比最近就有很多小伙伴们想要知道红米k20有几个颜
数码知识三星s10有几种颜色哪个颜色好看如今使用IT数码设备的小伙伴们是越来越多了,那么IT数码设备当中是有很多小技巧的,这些技巧很多小伙伴一般都是不知道如何来实用的,就好比最近就有很多小伙伴们想要知道三星s10有几种颜
广西高考试题(2021高考将增强试题开放性)广西高考试题(2021高考将增强试题开放性)昨天,2020年广西高考结束了!今天2020年广西高考使用全国卷III真题及参考答案出炉了!供广大读者学生及家长们参考估分祝大家金榜题名
2020七夕节是几月几日(今年七夕是周几2020七夕是哪一天)2020七夕节是几月几日(今年七夕是周几2020七夕是哪一天)立秋匆匆过,转眼是七月。农历的七月总是带着一丝甜蜜又有一丝神秘,毕竟在中国这是特殊的一个月。七月初有情人节,想必很多男
七夕节是几月几日(今年七夕是周几2020七夕是哪一天)七夕节是几月几日(今年七夕是周几2020七夕是哪一天)立秋匆匆过,转眼是七月。农历的七月总是带着一丝甜蜜又有一丝神秘,毕竟在中国这是特殊的一个月。七月初有情人节,想必很多男孩子都已
职业资格证书查询(网上可以直接考的证书)职业资格证书查询(网上可以直接考的证书)职业技能等级证,作为人才招聘,录用的重要证书,证书共分为5个等级,由第三方评价机构鉴定。根据国家政策规定,持有资格证可以申请职业技能补贴,享
河南省鹿邑县(河南周口鹿邑县穷吗)河南省鹿邑县(河南周口鹿邑县穷吗)封面新闻20170413185248封面新闻华西都市报记者熊浩然4月13日,有关河南省鹿邑县公安局原党委委员政治处主任邱海山伙同民警刘萍鹿邑县人社
云南有多少个市(甘肃有多少个市)一是GDP维度。129个县市区中,GDP1000亿元以上的仅有2个(官渡五华)500亿1000亿的仅有6个而GDP300亿500亿200亿300亿150亿200亿100亿150亿5
安阳美食(河南安阳特色小吃)安阳美食(河南安阳特色小吃)民以食为天,美食文化是一座城市文化的重要的组成部分。偏好什么口味就可以知道你是什么性格。一座城市的特色美食,也代表着这座城市的特点!安阳本地独特的特色小
连云港地震(连云港历史上的灾难)连云港地震(连云港历史上的灾难)原创紫牛新闻20210511170836前方指挥5月8日凌晨3点多,大多数人还沉浸在睡梦中,60名头顶红色头盔身着橙色救援服的消防指战员已经集结完毕
怎么查媳妇手机定位(怎样查对方的手机位置)怎么查媳妇手机定位(怎样查对方的手机位置)现在的社会,手机现已成为了万众随身的一种设备,它能够上网和联络朋友,能够作为人们的掌上电脑。现在的手机大多数都是智能化的,能够和电脑比美,
怎么通过手机查定位吗(查对方手机定位怎么查?)怎么通过手机查定位吗(查对方手机定位怎么查?)现在的社会,手机现已成为了万众随身的一种设备,它能够上网和联络朋友,能够作为人们的掌上电脑。现在的手机大多数都是智能化的,能够和电脑比
好用的手机定位软件有哪些(怎么查定位手机位置)好用的手机定位软件有哪些(怎么查定位手机位置)现在的社会,手机现已成为了万众随身的一种设备,它可以上网和联络朋友,可以作为人们的掌上电脑。现在的手机大多数都是智能化的,可以和电脑比
钳工工具(钳工工具一览表)钳工工具(钳工工具一览表)钳工主要是利用虎钳各种手用工具和机械工具来完成某些零件的加工,机器或部件的装配和调试,以及各类机械的维护与修理等工作。钳工工作拥有3大优点,2大缺点。3大
白菜的根(白菜根号称化痰根)白菜的根(白菜根号称化痰根)白菜,是北方朋友们最喜爱的蔬菜,特别是秋冬季节,白菜还可以当百菜吃,虽然我国人是宋朝才开始吃白菜,但钟爱度丝毫没有递减。白菜靠味道,便可以独霸市场,做法
燃烧的血论坛(燃烧的血网)燃烧的血论坛(燃烧的血网)燃烧的血20200306220933新冠肺炎的突然爆发,确确实实人人自危,稍微咳嗽一下,体温超过37。3,基本上就是属于离你远点的角色,即使不嫌弃你,也情
硬膜外血肿(硬膜下出血的原因)硬膜外血肿(硬膜下出血的原因)日常生活中,总会出现一些意外。很多人都会出现不小心撞到头的情况。虽然大多数情况下都是没有事的,但是还是要引起足够的注意,毕竟头的重要性大家都知道。如果
嘉宾致辞(受邀嘉宾发言稿简短)嘉宾致辞(受邀嘉宾发言稿简短)陈敏尔宣布开幕郝明金致辞唐良智主持黄强作为主宾省嘉宾致辞四川在线消息(记者李淼摄影田为)5月21日,以走进西部洽谈未来为主题的第三届中国西部国际投资贸
微信聊天记录可以随便查么?(怎么能恢复微信聊天记录)微信聊天记录可以随便查么?(怎么能恢复微信聊天记录)微信现已成为我们最常用的谈天东西,因为微信的运用率十分高,我们也常常会收拾一下微信谈天记载和其他软件的缓存文件来腾出手机空间。但
微信查找删聊天记录怎么查(查已删除的微信聊天记录)微信查找删聊天记录怎么查(查已删除的微信聊天记录)微信现已成为我们最常用的谈天东西,因为微信的运用率十分高,我们也常常会收拾一下微信谈天记载和其他软件的缓存文件来腾出手机空间。但有