spss相关分析某spss多因素显著性分析为显著相关，但是进入不了回归方程，那这个spss多因素显著性分析与

点击联系发帖人 时间：2017-03-16 19:29

spss 线性回归显著性

关注今日：4 | 主题：184367
微信扫一扫
扫一扫，下载丁香园 App
即送15丁当
【求助】单因素分析不显著，多因素回归显著，如何解释？
页码直达：
这个帖子发布于4年零81天前，其中的信息可能已发生改变或有所发展。
问题已解决悬赏丁当:20
做术后并发症的危险因素分析。先用卡方或Fisher精确检验做单因素分析，只有因素A显著，然后把A和其他几个临床上认为可能有映像的因素一起代入逻辑回归进行多因素分析，发现A显著，并且另一个在单因素分析中不显著的B也显著了，这怎么解释呢？
不知道邀请谁？试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
收起全部有料回复
个人意见：这是个exploratory研究，不是conformatory的，所以统计学处理上也应有不同。既然是术后并发症的危险因素分析，估计你的队列是分成有/无并发症两组。第一步应是两个队列基线数据的比较，年龄、BMI、A因素的比例～～～根据变量类型选择相应的统计学方法进行两组间比较，一般取alpha为0.05，列表呈现第二步是筛选回归方程要纳入的变量，有以下考虑：（1）统计学上有意义的，此时不必拘泥于0.05，一般应放到0.10，有些研究者甚至放到0.20（2）虽无统计学意义，但从医学科学角度有意义的（给出依据和逻辑）（3）变量之间不能有高度的相关性。相关性这个事情，很多变量之间多少都有点，真正所谓毫无相关性的独立因素其实是不多的，大样本量时多少都能发现点相关性。所谓高度相关性一般指相关系数绝对值超过0.8（也有研究者以0.9为界），相关系数达到这个水平就属于高度相关。高度相关的变量，不能同时纳入回归，必须进行取舍。（4）根据自己的样本量，框出回归能纳入的变量数（应变量＋自变量总数不能超过总样本量的10％，少些更好）第三步回归分析讨论：重点讨论回归得出的、回归系数较大（对此没有定论，一般自己定，但是你一个回归系数0.05的，即使有统计学意义，也不必去过多讨论）而有统计学意义的自变量和应变量的关系，结合以往的文献，给出自己的解释。对于回归系数小、但有统计学意义的，可带一句，但不必多费笔墨。如果出现预计应该有统计学意义的重要变量、实际却未有统计学意义，也可加以讨论。最后说一下，既然是要用回归，就没有必要去进行分层分析了。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
yuuyake edited on
可能原因：B是独立影响因素，但A和B之间可能存在关联，B的部分效应在单因素分析中被掩盖。比如说，B是个危险因素，A是保护因素，但具有B的个体多数兼有A，那么你就很难看到B的独立效应。而logistic回归在一定程度上可以处理这个问题。另一种可能：B只是单纯与A有关，而与因变量无关，但因为与A存在共线性，所以也被错误地纳入了方程。建议：按A分层，在A的不同水平分别观察B与因变量的关系。排除样本量小、统计效能不足的情况，仍有关联则考虑其为独立效应，关联消失则考虑可能是混杂因素。反之也可按B分层对A进行检查。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
可能原因：B是独立影响因素，但A和B之间可能存在关联，B的部分效应在单因素分析中被掩盖。比如说，B是个危险因素，A是保护因素，但具有B的个体多数兼有A，那么你就很难看到B的独立效应。而logistic回归在一定程度上可以处理这个问题。另一种可能：B只是单纯与A有关，而与因变量无关，但因为与A存在共线性，所以也被错误地纳入了方程。建议：按A分层，在A的不同水平分别观察B与因变量的关系。排除样本量小、统计效能不足的情况，仍有关联则考虑其为独立效应，关联消失则考虑可能是混杂因素。反之也可按B分层对A进行检查。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
谢谢jokerprince的解释！A因素是两种不同的治疗方式，B因素是体重指数的两个等级，确实存在你说的情况，体重指数高和第一种治疗方式相关，从临床专业上的解释是体重指数更大的患者更利于是使用第一种治疗方式。我按照你说的做了分层，A有两个水平A1和A2（A1有保护作用），B也有两个水平B1和B2（B2有危险作用），然后我做了卡方检验。A1分层下：B有显著作用，p=0.019A2分层下：B作用不显著，p=0.341B1分层下：A有显著作用，P=0.004B2分层下：A作用不显著，p=0.584这个结果说明什么呢？
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
james228 谢谢jokerprince的解释！A因素是两种不同的治疗方式，B因素是体重指数的两个等级，确实存在你说的情况，体重指数高和第一种治疗方式相关，从临床专业上的解释是体重指数更大的患者更利于是使用第一种治疗方式。我按照你说的做了分层，A有两个水平A1和A2（A1有保护作用），B也有两个水平B1和B2（B2有危险作用），然后我做了卡方检验。A1分层下：B有显著作用，p=0.019A2分层下：B作用不显著，p=0.341B1分层下：A有显著作用，P=0.004B2分层下：A作用不显著，p=0.584这个结果说明什么呢？这是比较典型的交互作用的表现。前两组说明：A1的治疗效果取决于体型；而后两组说明：对于B1体型的人来说，有一种治疗效果优于另一种（我才是A1较差，对吗？）。不过你最好要排除样本量偏小导致统计效能不足的可能性。如果与你们领域的专业认识不矛盾的话，那么这是很不错的结果。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
james228 做术后并发症的危险因素分析。先用卡方或Fisher精确检验做单因素分析，只有因素A显著，然后把A和其他几个临床上认为可能有映像的因素一起代入逻辑回归进行多因素分析，发现A显著，并且另一个在单因素分析中不显著的B也显著了，这怎么解释呢？好多叮当，我来抢答，如果觉得可以，别忘了给我叮当。首先，单因素分析无统计学意义而多因素logistic回归分析（甚至包括线性回归分析）有统计学意义，并不稀奇。这是回归的特点：相对于单因素分析，回归分析有更高的准确度/敏感性。第二，我觉得LZ过分纠结于有统计学意义了。对于回归分析，有统计学意义是第二位的（当然，没有统计学意义，说啥也是白搭）。第一位的是回归系数，因为它代表了该因素的effect强弱。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
谢谢和这么快的回复！应该是A1优于A2。
在已经做完的统计学分析中，治疗方式这个变量(A)不管在单因素还是多因素分析中都是显著的，A1的并发症明显少于A2，但是体重指数这个变量(B)只是在多因素分析中才是显著的，B2的并发症明显高于B1。我预期的结论是A1明显优于A2，这一点已经得到了证实。现在主要是如何解释体重指数和治疗方式之间的关系。
原始数据是这样的：
A1分层共75：其中B1: 51，有并发症7, 无并发症44
其中B2: 24，有并发症9，无并发症15
A2分层共179:其中B1: 157，有并发症55，无并发症102
其中B2:22，
有并发症10，无并发症12
B1分层共208，其中A1:51，有并发症7，无并发症44
其中A2: 157，有并发症55，无并发症102
B2分层共46，其中A1: 24，有并发症9，无并发症15
其中A2:22，有并发症10，无并发症12
虽然A2和B2分层下都没有显著意义，但是我觉得是因为B2的病例数比较少造成的，如果多一些的话应该能做出统计学差异，也就是说不管在哪个治疗方式下体重大的并发症都高，不管体重高还是低，A1治疗方式的并发症都少于A2。我想问一下就是看已经做好的多因素回归分析结果，A和B因素是独立的危险因素，是否能得出我上述的结论？
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
james228 edited on
james228 谢谢和这么快的回复！应该是A1优于A2。
在已经做完的统计学分析中，治疗方式这个变量(A)不管在单因素还是多因素分析中都是显著的，A1的并发症明显少于A2，但是体重指数这个变量(B)只是在多因素分析中才是显著的，B2的并发症明显高于B1。我预期的结论是A1明显优于A2，这一点已经得到了证实。现在主要是如何解释体重指数和治疗方式之间的关系。
原始数据是这样的：
A1分层共75：其中B1: 51，有并发症7, 无并发症44
其中B2: 24，有并发症9，无并发症15
A2分层共179:其中B1: 157，有并发症55，无并发症102
其中B2:22，
有并发症10，无并发症12
B1分层共208，其中A1:51，有并发症7，无并发症44
其中A2: 157，有并发症55，无并发症102
B2分层共46，其中A1: 24，有并发症9，无并发症15
其中A2:22，有并发症10，无并发症12
虽然A2和B2分层下都没有显著意义，但是我觉得是因为B2的病例数比较少造成的，如果多一些的话应该能做出统计学差异，也就是说不管在哪个治疗方式下体重大的并发症都高，不管体重高还是低，A1治疗方式的并发症都少于A2。我想问一下就是看已经做好的多因素回归分析结果，A和B因素是独立的危险因素，是否能得出我上述的结论？我觉得吧，以现在的结果还不好这样说独立效应，因为一者与结局的关联取决于另外一者的水平（至少目前的数据是这样）。这样的话更像是“效应修饰”。不过倒不是一定要独立效应才有意义。建议你再做个有交互项的logistic回归，看看结果如何。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
个人意见：这是个exploratory研究，不是conformatory的，所以统计学处理上也应有不同。既然是术后并发症的危险因素分析，估计你的队列是分成有/无并发症两组。第一步应是两个队列基线数据的比较，年龄、BMI、A因素的比例～～～根据变量类型选择相应的统计学方法进行两组间比较，一般取alpha为0.05，列表呈现第二步是筛选回归方程要纳入的变量，有以下考虑：（1）统计学上有意义的，此时不必拘泥于0.05，一般应放到0.10，有些研究者甚至放到0.20（2）虽无统计学意义，但从医学科学角度有意义的（给出依据和逻辑）（3）变量之间不能有高度的相关性。相关性这个事情，很多变量之间多少都有点，真正所谓毫无相关性的独立因素其实是不多的，大样本量时多少都能发现点相关性。所谓高度相关性一般指相关系数绝对值超过0.8（也有研究者以0.9为界），相关系数达到这个水平就属于高度相关。高度相关的变量，不能同时纳入回归，必须进行取舍。（4）根据自己的样本量，框出回归能纳入的变量数（应变量＋自变量总数不能超过总样本量的10％，少些更好）第三步回归分析讨论：重点讨论回归得出的、回归系数较大（对此没有定论，一般自己定，但是你一个回归系数0.05的，即使有统计学意义，也不必去过多讨论）而有统计学意义的自变量和应变量的关系，结合以往的文献，给出自己的解释。对于回归系数小、但有统计学意义的，可带一句，但不必多费笔墨。如果出现预计应该有统计学意义的重要变量、实际却未有统计学意义，也可加以讨论。最后说一下，既然是要用回归，就没有必要去进行分层分析了。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
yuuyake edited on
yuuyake 个人意见：这是个exploratory研究，不是conformatory的，所以统计学处理上也应有不同。既然是术后并发症的危险因素分析，估计你的队列是分成有/无并发症两组。第一步应是两个队列基线数据的比较，年龄、BMI、A因素的比例～～～根据变量类型选择相应的统计学方法进行两组间比较，一般取alpha为0.05，列表呈现第二步是筛选回归方程要纳入的变量，有以下考虑：（1）统计学上有意义的，此时不必拘泥于0.05，一般应放到0.10，有些研究者甚至放到0.20（2）虽无统计学意义，但从医学科学角度有意义的（给出依据和逻辑）（3）变量之间不能有高度的相关性。相关性这个事情，很多变量之间多少都有点，真正所谓毫无相关性的独立因素其实是不多的，大样本量时多少都能发现点相关性。所谓高度相关性一般指相关系数绝对值超过0.8（也有研究者以0.9为界），相关系数达到这个水平就属于高度相关。高度相关的变量，不能同时纳入回归，必须进行取舍。（4）根据自己的样本量，框出回归能纳入的变量数（应变量＋自变量总数不能超过总样本量的10％，少些更好）第三步回归分析讨论：重点讨论回归得出的、相关系数较大（对此没有定论，一般自己定，但是你一个相关系数0.05的，即使有统计学意义，也不必去过多讨论）而有统计学意义的自变量和应变量的关系，结合以往的文献，给出自己的解释。对于相关系数小、但有统计学意义的，可带一句，但不必多费笔墨。如果出现预计应该有统计学意义的重要变量、实际却未有统计学意义，也可加以讨论。最后说一下，既然是要用回归，就没有必要去进行分层分析了。同意统计学意义和专业意义并重的解读策略。最后一句无法认同。分层分析和多因素回归的作用并不完全重叠，尤其是当各自变量存在一定相关性，或者存在某些交互作用的情况下，很多审稿人都希望看到你的分层分析的结果，这更加直观，而不像回归那样失于笼统——特别是当分层因素有多个水平的情况下。之所以建议再做带交互项的回归，是考虑充分利用数据总体信息，希望在一定程度上规避分层后样本量的限制。所以个人建议是，分层分析结果和回归结果结合考虑。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
jokerprince 同意统计学意义和专业意义并重的解读策略。最后一句无法认同。分层分析和多因素回归的作用并不完全重叠，尤其是当各自变量存在一定相关性，或者存在某些交互作用的情况下，很多审稿人都希望看到你的分层分析的结果，这更加直观，而不像回归那样失于笼统——特别是当分层因素有多个水平的情况下。之所以建议再做带交互项的回归，是考虑充分利用数据总体信息，希望在一定程度上规避分层后样本量的限制。所以个人建议是，分层分析结果和回归结果结合考虑。其实你的观点和我的观点并不矛盾。如果只是讨论术后的某些影响因素，按照我上述步骤已经可以了。从某种意义上说，我上述步骤套路属于第一大块，或者说先要完成的。你谈到的分层分析可以做。没有问题。但这其实是第二大块——亚组分析的内容。一般是先完成第一大块，有余力再做第二大块。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
十分感谢两位的解释，受益匪浅！请问如何用spss做带交互项的回归？是不是就是在选择协变量的时候把A*B选进去？A*B选进去后还需要单独选择A和B吗？结果如何解释呢？
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
james228 十分感谢两位的解释，受益匪浅！请问如何用spss做带交互项的回归？是不是就是在选择协变量的时候把A*B选进去？A*B选进去后还需要单独选择A和B吗？结果如何解释呢？都需要。结果主要看交互项是否有统计学意义。注意，此时要把这三项的筛选方法设为enter，也就是必须纳入方程，否则如果A或B被剔除了就不符合logistic回归的基本要求（主效应项必须在）。有两种做法：一，只放这三项做回归；二，仍放进其他协变量。第二种应该可以通过layer来实现：把主要三项放在layer1，筛选策略为enter；其他项放在layer2，筛选测量可以用stepwise。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
jokerprince 都需要。结果主要看交互项是否有统计学意义。注意，此时要把这三项的筛选方法设为enter，也就是必须纳入方程，否则如果A或B被剔除了就不符合logistic回归的基本要求（主效应项必须在）。有两种做法：一，只放这三项做回归；二，仍放进其他协变量。第二种应该可以通过layer来实现：把主要三项放在layer1，筛选策略为enter；其他项放在layer2，筛选测量可以用backward或者其他。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
jokerprince 都需要。结果主要看交互项是否有统计学意义。注意，此时要把这三项的筛选方法设为enter，也就是必须纳入方程，否则如果A或B被剔除了就不符合logistic回归的基本要求（主效应项必须在）。有两种做法：一，只放这三项做回归；二，仍放进其他协变量。第二种应该可以通过layer来实现：把主要三项放在layer1，筛选策略为enter；其他项放在layer2，筛选测量可以用stepwise。谢谢。两种方法我都做了，结果如下：第一种，只放这三项回归，结果是A:0.585, B:0.405, A*B: 0.203第二种，通过Block实现，block2选择stepwise LR，结果是最后一步方程里只有A*B, p=0.002这个结果如何解释？
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
yuuyake （3）变量之间不能有高度的相关性。相关性这个事情，很多变量之间多少都有点，真正所谓毫无相关性的独立因素其实是不多的，大样本量时多少都能发现点相关性。所谓高度相关性一般指相关系数绝对值超过0.8（也有研究者以0.9为界），相关系数达到这个水平就属于高度相关。高度相关的变量，不能同时纳入回归，必须进行取舍。我用卡方检验发现A和B因素高度相关，p=0.000，可是这两个因素一个是手术方式，另一个是体重指数，不可能取舍啊？
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
james228 我用卡方检验发现A和B因素高度相关，p=0.000，可是这两个因素一个是手术方式，另一个是体重指数，不可能取舍啊？你理解错误了。1、相关是用统计软件包中专门的相关模块做的。2、相关首先看的是相关系数（类似回归先看回归系数），我所说的也是相关系数到0.8或0.9；第二才是看统计学意义。你做出来的是p值，不是相关系数。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
yuuyake 你理解错误了。1、相关是用统计软件包中专门的相关模块做的。2、相关首先看的是相关系数（类似回归先看回归系数），我所说的也是相关系数到0.8或0.9；第二才是看统计学意义。你做出来的是p值，不是相关系数。谢谢！我做了相关，相关系数是-0.233, p=0.000，是不是说明A和B之间虽然相关，但是相关性不是很大？
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
james228 谢谢！我做了相关，相关系数是-0.233, p=0.000，是不是说明A和B之间虽然相关，但是相关性不是很大？对的，此种相关系数，在回归而言，不认为是很强的相关性，可以同时纳入回归。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
james228 我用卡方检验发现A和B因素高度相关，p=0.000，可是这两个因素一个是手术方式，另一个是体重指数，不可能取舍啊？在考虑取舍问题之前，首先应该想一想，logistic回归在此是否合适。从分层分析的结果看，不论是A或者B似乎都独立地与结局存在关联。当然不能完全排除这种可能：B本来是连续变量（肥胖是人为划分为两类的，实际上则可以用BMI等等连续变量来表示），所以分层也不能完全排除另一变量的影响，导致了对A分析的假象；同时还有统计效能不足的问题，这一点你自己也提到了。但是无论如何，这与你最初的logistic回归结论不一致，因为基本肯定的是B是有独立作用的，而你最初的分析中它被剔除了。可见logistic并不适合你的数据。所谓的0.8，,0.9的相关系数作为判定标准，个人认为那只是经验之谈，就如样本量依据自变量个数乘以10一样。我建议你做交互项的logistic是希望看看这时候共线性的实际影响到什么程度，既然全都没有统计学意义，那看来仍然不适合。另外再次强调一点，结果的解释应当统计结合专业。对于可能由统计效能不足导致的问题（有关联但统计效能不足无法发现vs.确实无关联），要持谨慎态度，可有所倾向，但建议两方面兼顾。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
jokerprince 在考虑取舍问题之前，首先应该想一想，logistic回归在此是否合适。从分层分析的结果看，不论是A或者B似乎都独立地与结局存在关联。当然不能完全排除这种可能：B本来是连续变量（肥胖是人为划分为两类的，实际上则可以用BMI等等连续变量来表示），所以分层也不能完全排除另一变量的影响，导致了对A分析的假象；同时还有统计效能不足的问题，这一点你自己也提到了。但是无论如何，这与你最初的logistic回归结论不一致，因为基本肯定的是B是有独立作用的，而你最初的分析中它被剔除了。可见logistic并不适合你的数据。所谓的0.8，,0.9的相关系数作为判定标准，个人认为那只是经验之谈，就如样本量依据自变量个数乘以10一样。我建议你做交互项的logistic是希望看看这时候共线性的实际影响到什么程度，既然全都没有统计学意义，那看来仍然不适合。另外再次强调一点，结果的解释应当统计结合专业。对于可能由统计效能不足导致的问题（有关联但统计效能不足无法发现vs.确实无关联），要持谨慎态度，可有所倾向，但建议两方面兼顾。没有必要争论下去了。这个话题，目前其实来说有一定的定论，当然，统计学是一门在发展中的学问，也许未来会有新的观点。这个话题，其实就是统计学中的一个问题：存在confounders时如何处理？（假设以并发症的有无为outcome，治疗模式A为一个变量，则BMI可以视为是个confounder。Confounder有三种处理方法：如果confounder的变量数很少且每个变量水平也不多，则可以分层；只要总变量数不超过样本量的10%，且自变量之间不存在高度的相关性，回归分析都是适用的；如果回归分析也不适合，则考虑propensity score。至于0.8或者0.9，总变量数不超过样本量的10%，当然是一种约定俗成的做法，但这种约定的做法，是出现在欧美英文临床统计教科书的。统计学里，约定俗成的东西多了，最经典的，0.05的来历，就是大家约定俗成的。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
yuuyake 没有必要争论下去了。这个话题，目前其实来说有一定的定论，当然，统计学是一门在发展中的学问，也许未来会有新的观点。这个话题，其实就是统计学中的一个问题：存在confounders时如何处理？（假设以并发症的有无为outcome，治疗模式A为一个变量，则BMI可以视为是个confounder。Confounder有三种处理方法：如果confounder的变量数很少且每个变量水平也不多，则可以分层；只要总变量数不超过样本量的10%，且自变量之间不存在高度的相关性，回归分析都是适用的；如果回归分析也不适合，则考虑propensity score。至于0.8或者0.9，总变量数不超过样本量的10%，当然是一种约定俗成的做法，但这种约定的做法，是出现在欧美英文临床统计教科书的。统计学里，约定俗成的东西多了，最经典的，0.05的来历，就是大家约定俗成的。没有想到此贴已经上升到“争论”的程度了。个人绝无此意，实在看不出在园子里争论有什么很大的好处。我不想质疑统计学里一些经验性做法的合理性，只提一点：采用最常用的方法也许可以避免人家对方法学的质疑——没错我们可以说一般大家都是这么做的，但并不说明这就是正确的做法。举个例子：多数情况下人行道上绿灯的时候你走过去是安全的，但是某次你正要踏上去的时候发现有一醉汉开着摩托车飞奔而来，你还继续走上去吗？个人认为对于这些经验性原则还是灵活掌握，它有合理性，但毕竟难以做到完全的普适性。分层分析已经看到A和B分别与结局存在关联，而B在logistic回归里被剔除，可见AB之间的相关性已经影响了模型的建立。这种情况下，我实在不建议继续坚持使用logistic回归。供大家参考吧，也接受各种批评。相互学习，也不枉在园子里享受这挺多资源。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
jokerprince 没有想到此贴已经上升到“争论”的程度了。个人绝无此意，实在看不出在园子里争论有什么很大的好处。我不想质疑统计学里一些经验性做法的合理性，只提一点：采用最常用的方法也许可以避免人家对方法学的质疑——没错我们可以说一般大家都是这么做的，但并不说明这就是正确的做法。举个例子：多数情况下人行道上绿灯的时候你走过去是安全的，但是某次你正要踏上去的时候发现有一醉汉开着摩托车飞奔而来，你还继续走上去吗？个人认为对于这些经验性原则还是灵活掌握，它有合理性，但毕竟难以做到完全的普适性。分层分析已经看到A和B分别与结局存在关联，而B在logistic回归里被剔除，可见AB之间的相关性已经影响了模型的建立。这种情况下，我实在不建议继续坚持使用logistic回归。供大家参考吧，也接受各种批评。相互学习，也不枉在园子里享受这挺多资源。楼主最初剔除B因素（BMI），是因为卡方或Fisher单因素检验没有统计学意义（P&0.05），没有用多元logisitc回归，恰恰是LZ出于医学科学的考虑，将B因素纳入多元回归后，发现B因素的效应有统计学意义。你真的看懂LZ当初的描述了吗？在多元回归选择变量时的考虑因素（p要放到0.1~0.2，另外不能拘泥于统计学意义，还需要考虑临床意义），我已经在前面的帖子里描述过了，此处不再赘述。另外，你我的统计学的思路一开始就不同。你的思路是从interaction入手（所以你要求做交互项）。我的思路是从confounder入手。我们的区别在于，B因素（BMI）是否是个confounder。如果是confounder，则一般confouder的地位高于interaction，应该按照confounder去处理；如果不是confounder，则可酌情考虑为interaction。问题是：1、根据LZ给出的数据，做出A×B的2×2行列表，很遗憾，卡方显示，p在0.001～0.000左右，换言之，在B1和B2两组内，A1的分部是有显著差异的；同样我们也可以说在A1和A2两组内，B1的分布是有显著差异的，这就提示，如果要评估A的effect，那B就是A变量效应的confounder，不应按照interaction去考虑。2、通常情况下，不考虑interaction；主要在不同层内某因素的effect方向相反（例如在B1层内，A1的effect是正的；在B2层内，A1的effect是负的）时，在排除了confounder后，才会重点考虑interaction。如果effect方向相同，只是有大小差异，则除非有很合理的医学依据，否则一般不考虑interaction。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
yuuyake edited on
yuuyake 楼主最初剔除B因素（BMI），是因为卡方或Fisher单因素检验没有统计学意义（P&0.05），没有用多元logisitc回归，恰恰是LZ出于医学科学的考虑，将B因素纳入多元回归后，发现B因素的效应有统计学意义。你真的看懂LZ当初的描述了吗？在多元回归选择变量时的考虑因素，我已经在前面的帖子里描述过了，此处不再赘述。单因素分析的结果，只具有有限的参考价值，这里不提也罢。您怎么不提分层分析结果B出现了统计学意义？楼主自己也提到从专业角度他认为“不管在哪个治疗方式下体重大的并发症都高，不管体重高还是低，A1治疗方式的并发症都少于A2”。您不是也提倡统计和专业并重吗？我想重申我并无冲撞yuuyake站友之意，让我们把其他问题都放一放，就一个核心问题：要怎么解释分层分析的结果？这不是简单的单因素分析，因为有分层；也不存在由于没有纳入其他协变量从而造成与logistic回归结果差异的的情况——因为logistic回归里，只有A进入了方程。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
jokerprince 单因素分析的结果，只具有有限的参考价值，这里不提也罢。您怎么不提分层分析结果B出现了统计学意义？楼主自己也提到从专业角度他认为“不管在哪个治疗方式下体重大的并发症都高，不管体重高还是低，A1治疗方式的并发症都少于A2”。您不是也提倡统计和专业并重吗？我想重申我并无冲撞yuuyake站友之意，让我们把其他问题都放一放，就一个核心问题：要怎么解释分层分析的结果？这不是简单的单因素分析，因为有分层；也不存在由于没有纳入其他协变量从而造成与logistic回归结果差异的的情况——因为logistic回归里，只有A进入了方程。我修改了我的帖子，麻烦你再仔细看一下，这是最后一次回你的帖子。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
yuuyake 楼主最初剔除B因素（BMI），是因为卡方或Fisher单因素检验没有统计学意义（P&0.05），没有用多元logisitc回归，恰恰是LZ出于医学科学的考虑，将B因素纳入多元回归后，发现B因素的效应有统计学意义。你真的看懂LZ当初的描述了吗？在多元回归选择变量时的考虑因素（p要放到0.1~0.2，另外不能拘泥于统计学意义，还需要考虑临床意义），我已经在前面的帖子里描述过了，此处不再赘述。另外，你我的统计学的思路一开始就不同。你的思路是从interaction入手（所以你要求做交互项）。我的思路是从confounder入手。我们的区别在于，B因素（BMI）是否是个confounder。如果是confounder，则一般confouder的地位高于interaction，应该按照confounder去处理；如果不是confounder，则可酌情考虑为interaction。问题是：1、根据LZ给出的数据，做出A×B的2×2行列表，很遗憾，卡方显示，p在0.001～0.000左右，换言之，在B1和B2两组内，A1的分部是有显著差异的；同样我们也可以说在A1和A2两组内，B1的分布是有显著差异的，这就提示，如果要评估A的effect，那B就是A变量效应的confounder，不应按照interaction去考虑。2、通常情况下，不考虑interaction；主要在不同层内某因素的effect方向相反（例如在B1层内，A1的effect是正的；在B2层内，A1的effect是负的）时，在排除了confounder后，才会重点考虑interaction。如果effect方向相同，只是有大小差异，则除非有很合理的医学依据，否则一般不考虑interaction。……我就这么不招待见，别人要求我仔细看他的帖子，我的帖子没人仔细看。没错我是提出可能有交互作用，但是同时也说了要考虑样本量不足造成的影响，从审慎的角度应该两方面都进行考察。我也说了，关键问题不在这里，在于B进不了logistic回归却在分层分析出现关联，这跟有没有交互作用之间没有直接联系。最后，“除非有很合理的医学依据”一句，不知道把楼主说的“从临床专业上的解释是体重指数更大的患者更利于是使用第一种治疗方式”给忘到哪里去了。末了还是说一句，大家都是站友，愿大家皆好。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
jokerprince 在于B进不了logistic回归却在分层分析出现关联，这跟有没有交互作用之间没有直接联系。第一，你这句话就是错的，根据LZ的数据，我做了卡方，B因素的p在0.1~0.2之间，如我前面说的，即使是从统计学角度，纳入回归的变量，p也要放到0.1（保守些可以放到0.2），如果放到0.2，从统计学角度，B就该纳入回归。第二，LZ自己也说了B有临床意义，所以从临床角度，B也该纳入。总之，说B不应该纳入多元回归，本身就是没有道理的！其次，你注意到了A和B的分布了吗，我已经做了，A1/A2中B的分布是有差异的，而且差异有很大的统计学意义。在这种情况下，本身就不应该谈相互作用。应该把B视为A因素effect的一个confounder，并按此处理！
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
yuuyake 第一，你这句话就是错的，根据LZ的数据，我做了卡方，B因素的p在0.1~0.2之间，如我前面说的，即使是从统计学角度，纳入回归的变量，p也要放到0.1（保守些可以放到0.2），如果放到0.2，从统计学角度，B就该纳入回归。第二，LZ自己也说了B有临床意义，所以从临床角度，B也该纳入。总之，说B不应该纳入多元回归，本身就是没有道理的！其次，你注意到了A和B的分布了吗，我已经做了，A1/A2中B的分布是有差异的，而且差异有很大的统计学意义。在这种情况下，本身就不应该谈相互作用。应该把B视为A因素effect的一个confounder，并按此处理！关于第一条，不用说服我，说服审稿人就好了（我也没看到楼主提到B符合0.2的纳入条件。当然这要怪我没有验算，不过我相信您肯定是算了的）。关于AB相关的问题，我早就说了会有。但是相关和交互作用只能互斥，这种说法还是第一次听说。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
jokerprince 关于AB相关的问题，我早就说了会有。但是相关和交互作用只能互斥，这种说法还是第一次听说。这只能说明你的统计学得还不够。我没有说correlation和interaction互相排斥。不要曲解我的意思。你不知道Confounder是什么，interaction是什么。我的意思是：在明确存在confounder的情况下（广义而言，非特指本研究，如A是要考察的变量，B是明确的Confounder），不要去做（A和B）interaction的分析，没有任何意义，其结果也不会被承认！具体为什么，你自己再去好好读书吧！
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
yuuyake 这只能说明你的统计学得还不够。我没有说correlation和interaction互相排斥。不要曲解我的意思。你不知道Confounder是什么，interaction是什么。我的意思是：在明确存在confounder的情况下（广义而言，非特指本研究，如A是要考察的变量，B是明确的Confounder），不要去做（A和B）interaction的分析，没有任何意义，其结果也不会被承认！具体为什么，你自己再去好好读书吧！算了，君子断交仍不出恶言，您这种做派真是……对不起站友了，占了这么多楼还毁了您的帖子，抱歉！
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
jokerprince edited on
没想到这个帖子引起这么大的“争论”大家都是同行，都是受过高等教育的医生，相煎何太急呢？之所以有不同的意见和看法就是因为我们所谓的科学对于解释现实来说还是远远不够的对于我而言，我希望能通过这个研究例子更加深入的了解如何做多因素的分析，结果如何解释别人的文章里统计方法部分都写得比较简单，只有自己实际遇到的时候才发现有各种问题虽然我现在还是没有完全清楚，还是要感谢二位的详细解答，二位的解答我都选作满意回答了，不知道是否能够平均分配叮当
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
james228 没想到这个帖子引起这么大的“争论”大家都是同行，都是受过高等教育的医生，相煎何太急呢？之所以有不同的意见和看法就是因为我们所谓的科学对于解释现实来说还是远远不够的对于我而言，我希望能通过这个研究例子更加深入的了解如何做多因素的分析，结果如何解释别人的文章里统计方法部分都写得比较简单，只有自己实际遇到的时候才发现有各种问题虽然我现在还是没有完全清楚，还是要感谢二位的详细解答，二位的解答我都选作满意回答了，不知道是否能够平均分配叮当真是非常抱歉在您的贴子里搞得这么尴尬。但愿有一两句话对您是确实有用的。我之前的观点可能有过于偏激的地方，也没有考虑到您最初结果p值可能是接近0.05的这一问题——如果确实如此，建议同时考虑回归和分层的结果。祝好！另外，对于分层结果，还有一种方法实现两层的综合考虑，就是进行Woolf齐性检验，看两层的OR是否有统计学差异。如果有，提示可能有交互作用；如果没有，那么可以用Mantel-Haenszel公式进行合并分析，从整体上看OR值（不同于单纯地用所有数据进行单因素分析）是否有统计学意义。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
jokerprince 真是非常抱歉在您的贴子里搞得这么尴尬。但愿有一两句话对您是确实有用的。我之前的观点可能有过于偏激的地方，也没有考虑到您最初结果p值可能是接近0.05的这一问题——如果确实如此，建议同时考虑回归和分层的结果。祝好！另外，对于分层结果，还有一种方法实现两层的综合考虑，就是进行Woolf齐性检验，看两层的OR是否有统计学差异。如果有，提示可能有交互作用；如果没有，那么可以用Mantel-Haenszel公式进行合并分析，从整体上看OR值（不同于单纯地用所有数据进行单因素分析）是否有统计学意义。通常，分层和回归只需要一个，没有必要并存。例如A因素有两个水平，我想看A因素对outcome是否有显著影响，可以进行回归；当然我也可以将A因素水平分层，看不同层（亚组）的outcome是否有显著差异。这两种方法本身无所谓谁优于谁，影响outcome的因素少的时候，两者其实都可以选择。但是如果影响outcome的因素超过3个，一般就不作分层了，因为分不过来了。至于LZ的例子，已知有两个变量A和B需要考虑，还有其他影响预后的变量吗？有的话，分层就不必考虑了。Mantel Hanszel公式是meta分析用的，用来将不同研究的数据合并起来。当然，用于合并无明显异质性的亚组数据也可以。但现在的问题是，如果LZ做出来两层的OR无统计学差异，Mantel Hanszel公式合并的意义就大打折扣了，我不能直接用当初的原始数据去分析吗？实际上，只有在亚组OR有显著差异的时候，为了得到总体的OR，更需要使用Mantel Hanszel公式合并。举个例子，LZ想考核A因素对outcome的effect，分成A/non-A两组，但两组中B/non-B因素分部不均，且B因素也可能影响预后，这时候，可以用B因素分层，考察不同层内A的effect。如果两个层中A的effect没有明显差异，那就直接用总体数据去分析A的effect，根本不必使用Mantel Hanszel公式。通常只有在两个层中A的effect存在显著差异的情况下，才考虑使用Mantel Hanszel公式合并两个层的结果，以得出A的总体的effect。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
yuuyake edited on
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
学习中~~~~
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
lz您好，能不能请教您个问题。我在用sas进行一个单因素多水平统计分析，用的是GLM模型，然后我开始的时候没考虑区组因素，跑sas出来的结果是p=0.12，可是当我把区组因素也放进去后，统计分析的结果变成了Trt 的p值是0.07，block 是0.06，所请问下您，不是应该加入区组后，从总变异总扣除区组效应trt的p值更大吗？
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园}

常信村百科网