请教一个stata11教程问题

点击联系发帖人 时间：2014-12-14 03:47

stata11免费下载

丁香园App是丁香园社区的官方应用，聚合了丁香园论坛和丁香客的精彩内容。医生可通过丁香园App浏览论坛，也可以在这个医生群集的关系网络中分享和互动，建立更广泛的学术圈子。
扫描二维码下载
今日：23 | 主题：119822
每发1个新帖可以获得0.5个丁当奖励
【求助】请教一个stata11问题
【求助】请教一个stata11问题
分享到哪里？
这个帖子发布于5年零46天前，其中的信息可能已发生改变或有所发展。
初学stata,输入数据后使用metan命令，出现如下字符： string variable not allowed，Non integer or non-positive variables found。麻烦哪位高手指点迷津。先谢谢了。另外，不知使用中需要注意哪些地方？
爱眼 edited on
回复：【求助】请教一个stata11问题
分享到哪里？
我先下载了STATA10,然后按照园子里的第三种方法，软件自动下载安装了META程序，数据采用的是【系统评价指导手册】（杨克虎主编）上的数据，数据如下： +-------------------------------------------------+ | study year death1 live1 death2 live2 | |-------------------------------------------------| 1. | mrc-1
67 557 | 2. | cdp
64 707 | 3. | mrc-2
126 724 | 4. | gasp
38 271 | 5. | paris
52 354 | |-------------------------------------------------| 6. | amis 1 219 2038 | 7. | isis-2 17
| +-------------------------------------------------+然后使用了该书的命令：metan death1 live1 death2 live2,or label(namevar=study,yearvar=year)可是就出现了：Non integer or non-positive variables found
回复：【求助】请教一个stata11问题
分享到哪里？
以为是meta分析程序未能完全下载，故重新从网上下载了自带meta分析程序的STATA11版，在USER中可看到meta分析选项，输入同样数据及同样命令，结果出现了：varlist: death1: string variable not allowed实在是费解，烦请哪位高手指点迷津，不甚感激。
关于丁香园stata11常用命令（自己总结）
注：JB统计量对应的p大于0.05，则表明非正态，这点跟sktest和swilk检验刚好相反；
dta为数据文件；
gph为图文件；
do为程序文件；
注意stata要区别大小写；
不得用作用户变量名：
_all _n _N _skip _b _coef _cons _pi _pred _rc _weight double
float long int in if using with
读入数据一种方式
input& x& y
1&&&&&&&&&
su/summarise/sum x 或 su/summarise/sum x,d
对分组的描述：
sort group
by group:su x
tabstat economy,stats(max)& %返回变量economy的最大值
%%stats括号里可以是：mean，count(非缺失观测值个数)，sum(总和)，max，min，range，
sd，var，cv(变易系数＝标准差/均值)，skewness，kurtosis，median，p1(1％分位
数，类似地有p10, p25, p50, p75, p95, p99)，iqr(interquantile range = p75 &
_all　%描述全部
_N 数据库中观察值的总个数。
_n 当前观察值的位置。
_pi 圆周率π的数值。
gen/generate %产生数列
egen wagemax=max(wage)
by(分组变量)
set more 1/0
count %计数
gsort　+x& (升序)
gsort　-x& (降序)
升序；并且其它变量顺序会跟着改变
label var y "消费"& %添加标签
describe %描述数据文件的整体，包括观测总数，变量总数，生成日期，每个变量的存储类型(storage
type)，标签(label)
replace x5=2*y if x!=3 %替换变量值
replace age = 25 in 107& %令第107个观测中age为25
rename y2 u& %改变变量名
drop in 2& %删除全部变量的第2行
drop if x==. 删去x为缺失值的所有记录
keep if x&2&
%保留小于2的数据，其余变量跟随x改变
keep in 2/10& %保留第2-10个数
keep x1-x5& 　%保留数据库中介于x1和x5间的所有变量
(包括x1和x5)，其余变量删除
ci x1 x2,by(group)& %算出置信区间,不过先前对group要先排序，即sort
%by的意思逐个进行
cii 12 3..2710343, level(90)&
%已知均值，方差，计算90%的置信区间
cii 10 2& %obs=10,mean=2,以二项分布形式，计算置信区间
centile x,centile(2.5 25 50 75 97.5)& %取分位数
correlate/corr x y z& %相关系数
pwcorr x y,sig&&
%给出原假设r=0的命令
%如果变量非服从正态分布，则spearman x y
regress/reg mean year %回归方程建立 reg y x,noconstant %无常数项
meanhat&&&
%预测拟合值
predict e,residual %得到残差
estat hettest& % 异方差检验
dwstat&& %
Durbin-Watson自相关检验
% 方差膨胀因子
logit y x1 x2 x3 (y取0或1，是被解释变量，x1-x3是被解释变量) %logit回归
probit y x1 x2 x3 (y取0或1，是被解释变量，x1-x3是被解释变量) %probit回归
tobit y x1 x2 x3 (y取值在0和1之间，是被解释变量，x1-x3是被解释变量) %tobit回归
sktest e %残差正态性检验 p&0.05则接受原假设，即服从正态分布；
%% sktest是基于变量的偏度和斜度(正态分布的偏度为0，斜度为3)
swilk x& %基于Shapiro-Wilk检验
%%p值越小，越倾向于拒绝零假设，也就是变量越有可能不服从正态分布
xi& %生成虚拟变量
tabulat gender,summ(math)&
%用gender指标对math进行分类，返回两类math的mean、std、freq
tabulate=tab %gen f=int((shengao-164)/3)*3+164 组距为3
tabulate 变量名 [, generate(新变量) missing nofreq nolabel plot ]
generate(新变量) // 按分组变量产生哑变量
nofreq&&&&&&&&&&
// 不显示频数
nolabel&&&&&&&&&
// 不显示数值标记
plot&&&&&&&&&&&&
// 显示各组频数图示
missing&&&&&&&&&
// 包含缺失值
cell&&&&&&&&&&&&
// 显示各小组的构成比(小组之和为 1)
column&&&&&&&&&&
// 按栏显示各组之构成(各栏总计为 1)
row&&&&&&&&&&&&&
// 按行显示各组之构成(各行总计为 1)
求和，求最小？
mod(x,y) %求余数
means %返回三种平均值
di normprob(1.96)
di invnorm(0.05)
di binomial(20,5,0.5)
di invbinomial(20,5,0.5)
di tprob(10,2)
di invt(10.0.05)
di fprob(3,27,1)
di invfprob(3,27,0.05)
di chi2(3,5)
di invchi2(3,0.05)
stack x y z,into(e)& %把三列合成一列
xpose,clear&&&&&&&&&
append using d:\0917.dta& %把已打开的文件（x y z）跟0917里的（x
y z）合并，是竖向合并，即观察值合并；
merge using D:\0917.dta&&
%把已打开的文件（x y z）跟0917里的（a b）合并，是横向合并，即变量合并；
format x %9.2e& %科学记数
format x %9.2f& %2位小数
%产生随机数
%1 产生20个在(0，1)区间上均匀分布的随机数uniform()
set seed 100
set obs 20
gen r=uniform()
clear&&&&&&&&&&&&&&&&&&&&&
200&&&&&&&&&&&&&&
设置种子数为 200
20&&&&&&&&&&&&&&&&
设置样本量为 20
range no 1
20&&&&&&&&&&&&&
建立编号 1 至 20
r=uniform()&&&&&&&&&&&
产生在(0,1)均匀分布的随机数
group=1&&&&&&&&&&&&&&&
设置分组变量 group 的初始值为 1
r&&&&&&&&&&&&&&&&&&&&
对随机数从小到大排序
replace group=2 in 11/20&& 设置最大的
10 个随机数所对应的记录
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&
为第2组，即：最小的10个随机数所
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&
对应的记录为第1组
no&&&&&&&&&&&&&&&&&&&
按照编号排序
list&&&&&&&&&&&&&&&&&&&&&&
显示随机分组的结果
也可以list if group==1和list no if group==1
%2 产生10个服从正态分布N（100，6^2）的随机数invnorm(uniform())*sigma+u
clear&&&&&&&&&&&&&&&&&&&&&&&&&
200&&&&&&&&&&&&&&&&&&
设置种子数为 200
10&&&&&&&&&&&&&&&&&&&&
设置样本量为 10
gen x=invnorm(uniform())*6+100 产生服从 N(100，6^2)的随机数
注意有些图前面要加
histogram 直方图
scatter&& 散点图
scatter y x,c(l) s(d) b2("(a)")
graph twoway connected y x 连点图
graph bar (sum) var2,over(var1) blabel(total) %条形图
. graph bar p52 p72,by(d)&&
. graph bar p52 p72,over(d)
. graph bar p52 p72,by(d) stack
. graph bar p52 p72,over(d) stack
////////////数据如下
%d&p52&p72
%1&163.2&27.4
%2&72.5&83.6
%3&57.2&178.2
histogram x,bin(8) norm& %画直方图，加正态分数线
graph pie a b o ab if area==1,plabel(_all percent) %画饼图
graph pie var2, over(var1) plabel(_all
percent)&&&
graph pie p52 p72,by(d) %饼图
graph box y1 %箱体图
qnorm x&& %qq图
lfit y x& %回归直线
graph matrix gender economy math 多变量散点图
line yhat x||scatter y x,c(.l) s(O.) xline(12)
yline(5.4)& %线形图&散点图
有一些通用的选项可以给图形“润色”：
标题 title(“string”) （string可为任意的字符串，下同）
脚注 note(“string”)
横座标标题 xtitle(“string”)
纵座标标题 ytitle(“sting”)
横座标范围 xaxis(a,b) （a&b为两个数字，下同）
纵座标范围 yaxis(a,b)
插入文字 text （该命令既要指定插入文字的内容，也要指定插入的位置）
插入图例 legend （该命令既要指定图例的内容，也要指定其位置）
绘制散点图和线条的两个主要的选择项为：
connect(c...c)& //连接各散点的方式，c表示：
或简写为c(c...c)&& . 不连接 (缺省值)
&&&&&&&&&&&&&&&&&&
l 用直线连接
&&&&&&&&&&&&&&&&&&
L 沿x方向只向前不向后直线连接
&&&&&&&&&&&&&&&&&&
m 计算中位数并用直线连接
&&&&&&&&&&&&&&&&&&
s 用三次平滑曲线连接
&&&&&&&&&&&&&&&&&&
J 以阶梯式直线条连接
&&&&&&&&&&&&&&&&&&
|| 用直线连接在同一纵向上的两点
&&&&&&&&&&&&&&&&&&
II 同 ||, 只是线的顶部和底部有一个短横
Symbol(s...s)&& // 表示各散点的图形，s
或简写为s(s...s)&& O 大圆圈 (缺省值)
&&&&&&&&&&&&&&&&&&
&&&&&&&&&&&&&&&&&&
T 大三角形
&&&&&&&&&&&&&&&&&&
&&&&&&&&&&&&&&&&&&
&&&&&&&&&&&&&&&&&&
&&&&&&&&&&&&&&&&&&
&&&&&&&&&&&&&&&&&&
&&&&&&&&&&&&&&&&&&
[varname] 用变量的取值代码表示
&&&&&&&&&&&&&&&&&&
[_n] 用点的记录号表示
数学函数等都要与generate、replace、display一起使用，不能单独使用
程序文件do
use d:\0917.dta
line y x,saving(d:\d4)
按ctrl+D执行
字符串操作函数：
length(s)&&&&&&&&&
%长度函数，计算s的长度, 如，disp length("ab")的结果是2
substr(s,n1,n2)&&&
%子串函数，获得从s的n1个字符开始的n2个字符组成的字符串,
disp substr("abcdef",2,3)的结果是"bcd"
string(n)&&&&&&&&&
%将数值n转换成字符串函数，如，disp string(41)+"f"的结果是"41f"
real(s)&&&&&&&&&&&
%将字符串s转换成数值函数，如，disp real("5.2")+1的结果是6.2
upper(s)&&&&&&&&&&
%转换成大写字母函数，如，disp upper("this")的结果是"THIS"
lower(s)&&&&&&&&&&
%转换成小写字母函数，如disp lower("THIS")的结果是"this"
index(s1,s2)&&&&&&
%子串位置函数，计算s2在s1中第一次出现的起始位置, 如果s2不
&&&&&&&&&&&&&&&&&&&&
在s1中, 则结果为0。如，disp index("this","is")的结果是3,
&&&&&&&&&&&&&&&&&&&&&
而index("this","it")的结果是0
trim(s)&&&&&&&&&&&
%去除字符串前面和后面的空格
ltrim(s)&&&&&&&&&&
%去除字符串前面的空格
rtrim(s)&&&&&&&&&&
%去除字符串后面的空格
di sign(x)&&
%x&0时取1, x&0时取-1,
x=0时取0；& 符号函数
di int(x)&&&
%去掉x的小数部分, 得到整数 (取整函数)
sum(x)&&&&&&
%获得包括当前记录及以前的所有记录的x 的和。缺失值(missing value)当0处理;求和函数
max(x1,x2,...,Xn) 忽略缺失值;最大值函数
min(x1,x2,...,Xn) 忽略缺失值;最小值函数
float(x)&&&&
%将x转换成浮点表示法。
gen yy=cond(x&2,10,11) %条件函数cond(x,a,b) x可以是一个条件,
x非0(条件成立)时取a, x为0(条件不成立)时取b。
gen y1=recode(x,2,5)&&
%归组函数recode(x,x1,x2,...xn)
gen y2=autocode(x,3,-2,9)&
%autocode(x,ng,xmin,xmax)
自动将区间（xmin,xmax）分成ng个等长的小区间，其结果是包含x值那个小区间的上界值
如果不配对
ttestx1=x2,unpaired
ttestx1=x2,unequalunpaired
已知样本均数、标准差和样本数进行t检验：
ttesti 21 1.28 0.92 0.2&&
%检验均值是否等于0.2
检验两组均数是否相同：
ttesti 11 10 1.9 14 12.8 2.3
检验变量x1和x2的方差是否相同(即：齐性)
sdtestx1=x2
一、配对设计的平均水平检验
当总体服从正态分布时，可以选用t检验，否则用非参符号秩检验
signrankd=0
二、平行对照设计的两组资料平均水平统计检验
如果两组资料的方差齐性和相互独立的，并且每组资料服从正态
分布，则用成组t检验，否则可以用成组Wilcoxon秩和检验
ranksum x,& by(group)&
%2组资料中位数比较
kwallis& x, by(group)&
%多组资料中位数比较
anova x t id& %x为因变量，t跟id是因素
egenr=rank(x),by(id)& %产生秩r
单因素方差分析:
单因素方差分析又称为OnewayANOVA，用于比较多组样本的均数是否相同，
并假定：每组的数据服从正态分布，具有相同的方差，且相互独立，则无
效假设Ho:各组总体均数相同。在STATA中可用命令：
oneway& x& group,
mean& bonferroni&
%bonferroni用于多组样本均数的两两比较检验
logrank& t& outcome, by(group)
%单因素生存分析
两因素方差分析
多因素方差分析：anova y x1 x2 x1*x2
已投稿到：
以上网友发言只代表其个人观点，不代表新浪网的观点或立场。本文欢迎转载，转载请注明：转载自中国学网： []
用户还关注
可能有帮助苹果/安卓/wp
苹果/安卓/wp
积分 376, 距离下一级还需 74 积分
权限: 自定义头衔, 签名中使用图片
道具: 彩虹炫, 雷达卡, 热点灯, 雷鸣之声, 涂鸦板, 金钱卡, 显身卡, 匿名卡下一级可获得
道具: 抢沙发
购买后可立即获得
权限: 隐身
道具: 金钱卡, 雷鸣之声, 彩虹炫, 雷达卡, 涂鸦板, 热点灯
开心签到天数: 13 天连续签到: 1 天[LV.3]偶尔看看II
连老师，我原来听过您的课（10年），并由全套stata初级课程资料。但是，现在我还是将stata11装在D盘，发现ADO文件中一些您补充的案例却找不到，比如 xtcs.dta,& && && & // 中国上市公司资本结构数据，请问怎么找到并运行类似案例
支持楼主：、
购买后，论坛将把您花费的资金全部奖励给楼主，以表示您对TA发好贴的支持
载入中......
看看本版中的stata常见问题。
论坛好贴推荐
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
为做大做强论坛，本站接受风险投资商咨询，请联系（010-）
邮箱：service@pinggu.org
合作咨询电话：(010)
广告合作电话：（刘老师）
投诉电话：(010)
不良信息处理电话：(010)
京ICP证090565号
京公网安备号
论坛法律顾问：王进律师}

常信村百科网