电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

第三讲 Stata数据管理VIP免费

第三讲 Stata数据管理_第1页
1/30
第三讲 Stata数据管理_第2页
2/30
第三讲 Stata数据管理_第3页
3/30
孙健博士中央财经大学会计学院会计学实验室主任第三讲Stata数据管理变量名称•基本规则•由英文字母、数字或_组成,不超过32个字•首字母必须为字母或_•英文字母大写和小写具有不同的含义•示例•abca1a2Gdp都是合理的变量名•5gdp2invest则不是•注意:•建议不要使用“_”作为变量的首字母•Stata的内部变量许多是以_开头的,如_n,_N,_b等。变量的取值类型•字符型变量•存储格式str#,#表示该变量存储最多可容纳的字符数•如str7•数值型变量•整数(int)•浮点(float)•长整数(long)•双浮点(float)•日期型变量变量的显示格式•数值型变量的显示格式•e格式(科学计数法)•f格式(固定格式)•g格式(一般格式)•c格式(带千分符)•如%9.0g,%9.0f,%9.0fc•字符变量的显示格式•%#s•如%22s•%-14s,其中“-”表示左对齐变量的显示格式•日期型变量+---------------------------------------------------------------------+-----Numericalvalue&interpretation------FormatMeaningValue=-1Value=0Value=1--------+------------+---------------+---------------+---------------%tcclock31dec195901jan196001jan196023:59:59.99900:00:00.00000:00:00.001%tddays31dec195901jan196002jan1960%twweeks1959w521960w11960w2%tmmonths1959m121960m11960m2%tqquarters1959q41960q11960q2%thhalfyears1959h21960h11960h2%tggeneric-101+---------------------------------------------------------------------+字符型转为数值型•destring:字符中还有特殊符号,如“-,%”等•destringx,replaceignore(“-”)•real():字符中没有特殊符号•real(string)数值型转为字符型•tostring:•tostringx,replace•tostringx,gen(x1)•string:•genx=string(y)字符变量的操作•字符变量的分解:splitvar,parse(x)•splitdate,parse(-)•字符变量的合成:+•gena=b+c•dis“Iam”+”ateacher”•获取部分字符串:substr(x,t1,t2)•“2004-01-03”substr(x,1,4)=“2004”变量的显示格式•日期型变量•如何将字符串变为数值•以日期为例,命令date(string,mask)•如genx=date(date,“MDY”)修改变量的格式•format命令•formatvarlist%fmt•sysuseauto•练习变量的标签•标签是为变量、数据等提供说明,便于使用者更清晰的了解数据的结构和变量。•label命令•Labelvarname“label”•Sysuseauto,clear•Labelvarmake“make”基本数据操作命令•browse•edit•rename•save•describe•list•codebook•display•sortStata中的表达式:算术表达式•+•—(减号或负号)•*•/•^(乘方)•dis(2+3*9^3)^0.5/6^3Stata中的表达式:关系和逻辑表达式•==(等于)•!=(不等于)•>•<•>=•<=•|(或)•&(且)•listifage<20•listifage>20&age<50•listifage<20|age>50数据子集的定义•in命令:用于指定观测值,可以是某一个观测值,也可以是某个区间•Listin20/30•Listin1/10•Listin-10/-1•if命令:如果•Listifage==20•by命令:非常重要•用来对某些具有相同复制的样本子集重复执行命令•byvarlist:stata_cmd•Bysortvarlist:stata_cmd•如bysortsex:keepifage==20变量的相关操作•产生新变量:generate命令•genxy;genx=1;genx=x^2•替换已有变量:replace命令(该命令不能缩写)•replacex=2ifx=1•产生特殊函数值的命令:egen•egenx=mean(y)•gendy=y-x•genx1=median(y)变量的相关操作•产生新变量:generate命令•genxy;genx=1;genx=x^2•替换已有变量:replace命令(该命令不能缩写)•replacex=2ifx==1•产生特殊函数值的命令:egen•egenx=mean(y)•gendy=y-x•genx1=median(y)•删除变量和记录的命令:drop•dropx•dropifx==2•保留记录的命令:keep•keepifx==2_n和_N•_n:样本序号变量,是一个变量,内容为1,2,3,...,n•_N:样本数指标,是一个单值,内容为样本数•_n是一个永远存在,但却不能list出来的特殊变量•_n的取值会随样本排序的变化而变化_n和_N的应用•产生滞后项:genlagsales=sales[_n-1]•产生前导项:genlagsales=sales[_n+1]...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

第三讲 Stata数据管理

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部