SPSS如何做COX预测模型预测控制的校准图

点击联系发帖人 时间：2018-05-11 07:45

预测模型图片

苹果/安卓/wp
积分 22, 距离下一级还需 2 积分
道具: 彩虹炫, 涂鸦板, 雷达卡, 热点灯, 金钱卡
购买后可立即获得
权限: 隐身
道具: 金钱卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
本帖最后由 wanghaidong918 于
02:27 编辑
我是做多因素与生存时间分析的。
& & 我先用Kaplan-Meier法划各个因素不同时的生存曲线，用Log-rank检验对生存曲线比较差别。然后我用COX单因素先统计该因素的RR，再看其有无统计学意义，有我就放进cox回归模型。这样问题就出来了，Log-rank认为该因素有统计学意义，而COX单因素分析时确无统计学意义。比如：我年龄分2组（1组&61;2组&61），Log-rank认为1组跟2组与生存时间有差别（P=0.047），而用COX单因素时（P=0.054），无统计学意义，请问这是为什么呢？
& & 我把我的数据发在附件，我想用K-M法描述生存曲线，然后用Log-rank检测各个因素中分组的差别；再用COX回归模型统计各个因素对预后的影响。如果有朋友可以帮忙的话，恳请指教！不胜感激！
15:40:55 上传
本帖被以下文库推荐
& |主题: 2161, 订阅: 21
我也出现过这个问题，但是你的P值都在0.05附近哈
不知道是不是因为log针对的是整体，而你的单因素RR则不是的缘故
哈哈，这个问题实际上在统计中会经常碰到，特别是在p值在0.05附近的时候，用不同的检验方法有时会出现不同的显著性结果，但是对于我们需要结论的角度看，实际上还是要看样本量，如果你的样本量足够大的话，即使p值稍大于0.05（统计学上解释无显著性），在0.05附近，从实际意义上仍然可以认为该因素是显著的。如果样本量较小，那么下结论就要谨慎了哦，从严角度看，应该以p值较小的为准的哦，呵呵
yangpluszhu
yangming98 如果样本量较小，那么下结论就要谨慎了哦，从严角度看，应该以p值较大的为准的哦，呵呵
yangpluszhu
这个样本量是用了245例了&&不知道算不算大&&然后我应该怎么走下一步呢？
我的数据在附件那（cox.xls），有兴趣的朋友帮忙统计试试！
求教：K-M法以及Log-rank有什么作用？初学者！在做Cox多元分析时，先要做哪些检验吗？做完回归后，应该看哪些统计指标，非常感谢！还有很多需要向您请教，方便的话，我QQ，十分感谢！
求教：K-M法以及Log-rank有什么作用？初学者！在做Cox多元分析时，先要做哪些检验吗？做完回归后，应该看哪些统计指标，非常感谢！还有很多需要向您请教，方便的话，我QQ，十分感谢！
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向，请联系（010-）；
邮箱：service@pinggu.org
投诉或不良信息处理：（010-）
论坛法律顾问：王进律师苹果/安卓/wp
学科带头人
学科带头人
积分 5281, 距离下一级还需 544 积分
权限: 自定义头衔, 签名中使用图片, 隐身, 设置帖子权限, 设置回复可见
道具: 彩虹炫, 涂鸦板, 雷达卡, 热点灯, 金钱卡, 显身卡, 匿名卡, 抢沙发, 提升卡, 沉默卡, 千斤顶下一级可获得
道具: 变色卡
购买后可立即获得
权限: 隐身
道具: 金钱卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
开心签到天数: 234 天连续签到: 3 天[LV.7]常住居民III
人大经济论坛经管爱问微信好号“jgasker”好文共享与推荐，实时答疑服务，欢迎关注！控制图（Control Chart）又称管理图，它是用来区分是由异常原因引起的波动，还是由过程固有的原因引起的正常波动的一种有效的工具。控制图通过科学的区分正常波动和异常波动，对工序过程的质量波动性进行控制，并通过及时调整消除异常波动，使过程处于受控状态。不仅如此，通过比较工序改进以后的控制图，还可以确认此过程的质量改进效果。因此，控制图在质量管理中有着广泛的应用。控制图由样本均值服从于正态分布演变而来。正态分布可用两个参数即均值μ和标准差σ来决定。正态分布有一个结论对质量管理很有用，即无论均值μ和标准差σ取何值，产品质量特性值落在μ±3σ之间的概率为99.73%，落在μ±3σ之外的概率为100%-99.73%= 0.27%，而超过一侧，即大于μ+3σ或小于μ-3σ的概率为0.27%/2=0.135%≈1‰，，休哈特就根据这一事实提出了控制图。图上有中心线(CL)、上控制限(UCL)和下控制限(LCL)，并有按时间顺序抽取的样本统计量数值的描点序列。多数情况下是通过人工来绘制控制图，首先通过计算器计算各种指标，然后再一步步地绘制控制图。在这个过程中，往往会出现计算错误或者误差过大等原因，使得最后的控制图达不到预期的效果，更为严重的是能使质量管理者产生错误的判断，做出错误的决策，从而产生较大的损失。也有的企业利用excel绘制控制图，从而提高其精确度，减少误差。然而，用excel绘制控制图的步骤比较繁杂，不容易掌握，容易在绘制过程中产生操作性失误，造成数据集的失真。SPSS的图形工具非常强大，具有很强的统计分析功能。在质量数据管理中，经常要用到一些图形方法和工具，例如帕雷托图、直方图、散点图、控制图、序列图等，SPSS均可以有效地应用这些图形方法和工具来处理质量数据信息，这些功能集中在Graph菜单中。因此，此处我们采用SPSS来绘制控制图。SPSS控制图的选择依据（X-R或X-S和X-MR）根据主要测量值分组变量的具体情况，可选择X-R、X-S，即均值-极差和均值-标准差控制图；或者选择X-MR，个体-移动均值控制图。1、分组变量中有大于10个组值，宜于计算标准差，故选择X-S控制图。2、分组变量中有小于10个组值，选择计算极差，即X-R控制图。3、分组变量中只有1个组值，则选择个体-极差控制图，即X-MR控制图。案例：个体-移动极差控制图数据data17-18为某搅拌站实测混凝土坍落度数据，现在使用控制图看看工艺质量情况。步骤：分析—质量控制—控制图—个体/移动全距—个案为单元过程度量：选择“测量值变量；标注子组：选择“编号”自动生成以下两组控制图，可用于综合解读。第一张是均值X的控制图，第二张是移动均值的控制图。上面我们已经完成了数字层面的分析，最关键的则是发现数据的异常和寻找异常发生的原因。由于本案例数据源来自书籍，并无具体案例数据的实际描述，因此不宜在此处做过多的解读。详细的规则解读可参考以下内容。质量控制图的使用规则既然质量控制图是为了帮助我们及时发现指标的不正常状态，那么当我们看到上面的图以后，需要观察和分析是不是存在异常的点或异常的变化趋势，如何定义这些异常，需要有一套控制规则：即样本点出界或者样本点排列异常：点超出或落在ULC或LCL的界限；（异常）近期的3个点中的2个点都高于+2σ或都低于-2σ，近期5个点中的4个点都高于+σ或都低于-σ；（有出现异常的趋势）连续的8个点高于中心线或低于中心线；（有偏向性）连续的6个点呈上升或者下降趋势；（有明显的偏向趋势）连续的14个点在中心线上下呈交替状态。（周期性，不稳定）查资料时发现不同的地方对控制规则有不同的定义，我这里参照的是SPSS里面的规则，具体应该可以根据实际的应用环境进行调整。转载于CDA数据分析师，文 | 数据小兵&微信原文：http://mp.weixin.qq.com/s?__biz=MzA3NDkyNTc4Ng==&mid=&idx=3&sn=d683121cfd19d53fb6bbcd8&scene=4
iRolly 发表于
人大经济论坛经管爱问微信好号“jgasker”好文共享与推荐，实时答疑服务，欢迎关注！控制图（Control Chart ...厉害哦
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向，请联系（010-）；
邮箱：service@pinggu.org
投诉或不良信息处理：（010-）
论坛法律顾问：王进律师关注今日：24 | 主题：205208
微信扫一扫
SPSS中COX回归方法选择，望路过的大神指点迷津~
页码直达：
问题已解决悬赏丁当:5
文献中对统计方法的描述：“Significant factors from univariate selection were kept in the multivariate analysis by using backward selection and the SCORE method for the best predictor set.
”此处 backward selection是多COX分析时当中的哪一种呢？我用的SPSS19中文版，里面有向后条件，向后 LR，向后 WALD，我应该选择哪一种呢？看几篇文献都是只提到backward，但都没有具体说哪一种。。。
这个链接文档里有部分解释，但还是似懂非懂，不造应该选择哪一种......
我做的是预后的生存分析，先单因素后多因素，单因素用的进入法，一个一个跑的，文档中描述可以用前向的任何一种方法，然后选择at each step，选择第0步的结果作为单因素结果。但多因素没有讲的很清楚，还望路过的大神指点迷津，感激不尽······
不知道邀请谁？试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
楼主我想问你个问题，需要把所有的连续变量都二分类吗，还是直接放入连续变量呢……
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
红装听雨楼主我想问你个问题，需要把所有的连续变量都二分类吗，还是直接放入连续变量呢……我是把所有的变量分为二分类变量的，因为后面还要做生存曲线
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
里面有向后条件，向后 LR，向后 WALD，都可以做下的，那个结果理想用哪个
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园张向阳教授系列经验谈之统计篇（二）：《如何采用SPSS的Cox方法做生存分析和条件logistic回归分析》_突袭网
当前位置&:&&&&张向阳教授系列经验谈之统计篇（二）：《如何采用SPSS的Cox方法做生存分析和条件logistic回归分析》
热门标签：&
张向阳教授系列经验谈之统计篇（二）：《如何采用SPSS的Cox方法做生存分析和条件logistic回归分析》
编辑：王亮
编者按本公众号将陆续刊发美国德州大学休斯顿医学院张向阳教授发表SCI论文的经验和临床科研思路，以帮助大家书写和发表高水平的SCI文章。本文是张向阳教授发表SCI论文系列经验谈之统计篇（二）：《如何采用SPSS的Cox方法做生存分析和条件logistic回归分析》，刊发在公众号里，以飧读者。如何采用SPSS的Cox方法做生存分析和条件logistic回归分析第一部分、生存资料的Cox 回归分析生存资料的Cox回归分析是临床上常见的统计分析方法，比如：拟观察某新药的抗肿瘤效果，将癌症患者随机分为两组，分别采用该新药和常规药物进行治疗，观察两种治疗对患者的生存作用，共随访2年。研究以死亡为结局，两种治疗方式为主要研究因素，同时考虑调整年龄、性别、病程和疾病严重程度等的影响，比较两种疗法对癌症患者生存的影响是否有差异。一、研究问题和目的下面以我们自己的研究为例，我们都知道吸烟者首次吸烟的年龄不一，有人15岁开始吸，有人18岁，更早的有11、12岁，甚至7、8岁，有人很晚到40多岁等。我们也知道精神分裂症病人吸烟比例远远高于正常人，那么我们的问题就是：与正常人相比，精神分裂症病人首次吸烟年龄如何？就是这样多提了一个问题、这样一个简单思路，采用了生存分析，就发表在Schizophrenia Research上（Smoking initiation and schizophrenia: A replication study in a Chinese Han population. Schizophrenia R 0-114），尤其是这篇文章里的数据在此之前已经发表过文章了。二、对数据结构的分析该研究以是否吸烟为结局，首次吸烟年龄为主要研究因素，每个吸烟者都有首次吸烟年龄，同时考虑调整年龄、教育等的影响（因为精神分裂症病人女性吸烟率很低，本研究只考虑男性吸烟情况）。研究目的是了解病人组和正常组的首次吸烟年龄是否有差异，用 Cox 回归进行分析。（说明：Cox 回归的结局不一定是死亡，也可以是发病、再入院等。其共同特点是，不仅考察结局是否发生，还考察结局发生的时间）。三、SPSS 具体运算数据录入SPSS：见图一：（说明：这组数据只是为了举例，仅仅列入29例）（图一）2. 具体操作：找到Analyze，下拉菜单，找到 Survival, 进入，点击Cox Regression，见图二：（图二）3. 选项设置：1）主对话框设置：将首次吸烟时间变量送入Time框中将吸烟组状态送入 Status 框中点击 Define Event 定义事件发生的数值（此例中为吸烟，用 1 表示） Continue 将分组（病人vs正常组和需要调整的变量age和education送入Covariates 框中 Method：可以选择 Forward：LR，或者默认Enter。见图三：（图三）说明：对于自变量筛选的方法（Method 对话框），SPSS 提供了7种选择，使用各种方法的结果略有不同，读者可相互印证。各种方法之间的差别在于变量筛选方法不同，其中Forward：LR 法（基于最大似然估计的向前逐步回归法）的结果相对可靠，但最终模型的选择还需要获得专业理论的支持。2）Categorical Covariates 选项设置：将分类变量 group 选入右侧 Categorical Covariates 里并选择 Reference Category 以 First 为参比（即选择最小数值为参照组），其他按默认选项 Change Continue，见图四：（图四）注意：在数据录入时，建议将二分类变量赋值为 0 和 1；多分类变量赋值为 0、1、2、3 或者 1、2、3、4 等，并根据以下情况设置 Categorical Covariates 选项：A. 以下情况，可以不定义 Categorical Covariates 选项：当自变量是二分类变量，并且赋值的差值为 1，例如赋值为 0 和 1，也不需要绘制该变量不同组间的生存曲线时。B. A以外的情况都必须定义Categorical Covariates选项。需特别注意两种情况：当自变量是二分类变量，但要在 Plots 选项中设置，得到不同组间的生存曲线时。比如本例中，group为二分类变量，但要观察病人组和正常组间的生存曲线，就需要在Categorical Covariates选项中定义group变量；多分类变量时。3）Plots 选项设置：绘制生存曲线，可选择 Plots Type 中的 Survival 作为输出的图形将主要分类变量选入右侧 Separate lines for 中，可以输出该变量不同组间对应的生存曲线，其他按默认选项 Continue。见图五：（图五）4）Options 选项设置：选择 Model Statics 中的 CI for exp (B) 要求输出 HR 值的 95% 置信区间选择 Display model imformation 中的 At last step（即要求仅输出最后一步的模型），其他按默认选项 Continue OK，见图六：（图六）四、结果解读1）我们只需要看这一结果：Variables in the Equation。结果显示：Wald x2=5.108, df=1, p=0.024，说明两组首次吸烟年龄有显著性差异。相对危险度 HR=Exp (B)=0.232，说明患者首次吸烟年龄比正常组早1.232 倍。HR 的 95% 可信区间（95% CI）为 0.065-0.824。2）生存曲线：前述Plots选项的设置要求输出病人组和正常组的生存曲线。病人组比（绿线）比正常组（黑线）的生存率低，说明病人组首次吸烟年龄显著性早于对照组。见图七：（注意：该图片并未编辑，只是为了举例，不符合给杂志投稿的要求）。（图七）3）结论：精神分裂症病人组首次吸烟年龄显著性早于正常对照组（X2=5.108,df=1,p=0.024）。在原文中（不是目前的这个图），在20岁以前，两组的曲线几乎重叠，但20岁后，病人组明显陡峭起来。说明20岁以前，两者首次吸烟年龄差不多，但20岁后，病人首次吸烟年龄提前。第二部分、条件logistic回归分析按照研究设计的不同，可将逻辑（logistic）回归分为成组资料的非条件逻辑回归和配对资料的条件逻辑回归两类。成组资料是指组与组之间是相互独立的，没有针对每一个病例去寻找他特定的对照。配对资料是指研究设计之初，根据潜在的影响因素如性别、年龄等将病例与对照配成对子，可以是一个病例配一个对照，也可以是一个病例配n个对照。对于成组资料，采用的是非条件逻辑回归；对与配对资料，采用的是条件逻辑回归，两者之间有着明显的区别。再看一个例子：对病例和对照进行配比能控制影响实验效应的主要非处理因素，可以提高统计分析的效能，可分为1:1，1:n，m:n配对。SPSS中未提供专用的配对logistic回归的功能，通过变换，可以使用其他方法进行分析，常用的就是带有分层的Cox回归模型。给每一条记录一个虚拟的生存时间，一般默认病例组的生存时间较对照组短，病例算事件发生，对照算作删失，把配对因素算作分层因素，消除配对因素的影响。比如：调查某地65岁居民发生严重感冒的情况，根据性别、年龄每个病例配两个对照，研究目的是分析注射疫苗和肺部疾病与患严重感冒之间的关系。相关变量级取值如下：id：配对的对子号；outcome：虚拟的生存时间，病例取值为1，对照取值为2。（也可以取其他值，如1，100，只要对照大于病例的生存时间即可）；lung：是否患肺部疾病，1代表有，0代表无；vaccine：是否注射疫苗，1代表是，0代表否；status：虚拟生存状态变量，病例组全为1，代表事件发生，对照组全为0，代表删失。本例与普通Cox模型操作相同，只需要将id作为分层变量选入模型即可。小结：我们常规做的logistic回归都是非条件逻辑回归，conditional logistic regression：指的是配对资料的回归，可以是1：1，或1：n，而条件逻辑回归可以用Cox regression。给每条记录一个虚拟的生存时间，一般认为病例比对照的生存时间短即可（比如病例为1，对照为2；病例为1，对照为大于1 的值即可），病例算事件（设为1），对照算删失（设为0）。把配对数（比如1， 2， 3， ...... 80）作为分层strata 因素，就可以了。S C I 黄埔军校传授发表SCI论文独家秘籍和写作方法，提高科研思路和设计水平。
更多精彩 >>>关注今日：24 | 主题：205208
微信扫一扫
【求助】多因素cox回归spss如何做，谢谢（已解决）
页码直达：
这个帖子发布于5年零133天前，其中的信息可能已发生改变或有所发展。
如图在使用spss做cox回归分析，图中性别、年龄、部位对骨巨细胞瘤复发的影响，图中结果性别、年龄、部位第一个个因素male ，≤25years和Distal 均为1.000，请问这在spss中cox回归分析中如何实现，具体步骤请告知，谢谢。指导后分析结果非常感谢的指导，如上图，我分析的结果表一说明是以第一个股骨为参考，他的HR或OR值就是1，同时（1）=胫骨；（2）=肱骨；（3）=腓骨；（4）=桡骨所以表二的结果是：HR或OR值，即Exp(B),分别为股骨1.000；胫骨1.212；肱骨0.909；腓骨0.865；桡骨1.070请问这样对不对，盼再次赐教。
不知道邀请谁？试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
vvv001 编辑于
你问的也太广泛了吧你现在是做到哪个步骤，哪个不会做？能不能问的具体些，我也好帮你
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
有时间，复发，还有很多因子比如部位我已经把时间，复发都选进spss相应位置，部位也选进去，部位分为股骨，胫骨，腓骨，桡骨等。如何进一步设置，让部位里的股骨，胫骨，腓骨，桡骨进行比较，而部位为1.00，其他有软件自动得出，如楼顶图表location的比较结果
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
非常感谢的指导，如上图，我分析的结果表一说明是以第一个股骨为参考，他的HR或OR值就是1，同时（1）=胫骨；（2）=肱骨；（3）=腓骨；（4）=桡骨所以表二的结果是：HR或OR值，即Exp(B),分别为股骨1.000；胫骨1.212；肱骨0.909；腓骨0.865；桡骨1.070请问这样对不对，盼再次赐教。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园}

常信村百科网