stata11 常用命令 注:JB 统计量对应的p 大于0.05,则表明非正态,这点跟sktest 和swilk检验刚好相反; dta 为数据文件; gph 为图文件; do 为程序文件; 注意stata 要区别大小写; 不得用作用户变量名: _all _n _N _skip _b _coef _cons _pi _pred _rc _weight double float long int in if using with 命令: 读入数据一种方式 input x y 1 4 2 5.5 3 6.2 4 7.7 5 8.5 end su/summarise/sum x 或 su/summarise/sum x,d 对分组的描述: sort group by group:su x %%%%% tabstat economy,stats(max) %返回变量economy 的最大值 %%stats 括号里可以是:mean,count(非缺失观测值个数),sum(总和),max,min,range, %% sd,var,cv(变易系数=标准差/均值),skewness,kurtosis,median,p1(1%分位 %% 数,类似地有p10, p25, p50, p75, p95, p99),iqr(interquantile range = p75 – p25) _all %描述全部 _N 数据库中观察值的总个数。 _n 当前观察值的位置。 _pi 圆周率π 的数值。 list gen/generate %产生数列 egen wagemax=max(wage) clear use by(分组变量) set more 1/0 count %计数 gsort +x (升序) gsort -x (降序) sort x 升序;并且其它变量顺序会跟着改变 label var y "消费" %添加标签 describe %描述数据文件的整体,包括观测总数,变量总数,生成日期,每个变量的存储类型(storage type),标签(label) replace x5=2*y if x!=3 %替换变量值 replace age = 25 in 107 %令第107 个观测中age 为25 rename y2 u %改变变量名 drop in 2 %删除全部变量的第2 行 drop if x==. 删去x 为缺失值的所有记录 keep if x<2 %保留小于2 的数据,其余变量跟随x 改变 keep in 2/10 %保留第2-10 个数 keep x1-x5 %保留数据库中介于x1 和x5 间的所有变量 (包括x1 和x5),其余变量删除 ci x1 x2,by(group) %算出置信区间,不过先前对 group 要先排序,即 sort group; %by 的意思逐个进行 cii 12 3.816667 0.2710343, level(90) %已知均值,方差,计算90%的置信区间 cii 10 2 %obs=10,mean=2,以二项分布形式,计算置信区间 centile x,centile(2.5 25 50 75 97.5) %取分位数 correlate/corr x y z %相关系数 pwcorr x y,sig %给出原假设 ...