步骤一:导入数据原始表如下,数据请以时间(1998,1999,2000,2001⋯⋯)为横轴,样本名(北京,天津,河北⋯)为纵轴⋯将中文地名替换为数字
注意:表中不能有中文字符,否则会出现错误
面板数据中不能有空值
去除年份的一行,将其余部分复制到stata的dataeditor中,或保存为csv格式
打开stata,调用数据
方法一:直接复制到dataeditor中
方法二:使用口令:insheetusing文件路径调用例如:insheetusingC:\STUDY\paper\taxi
csv其中csv格式可用excel的“另存为”导出步骤二:调整格式首先请将代表样本的var1重命名口令:renamevar1样本名例如:renamevar1province也可直接在var1处双击,在弹出的窗口中修改:接下来将数据转化为面板数据的格式口令:reshapelongvar,i(样本名)例如:reshapelongvar,i(province)其中var代表的是所有的年份(var2,var3,var4⋯⋯)转化成功后继续重命名,其中_j这里代表原始表中的年份,var代表该变量的名称口令例如:rename_jyearrenamevartaxi也可直接在需要修改的名称处双击,在弹出的窗口中修改步骤三:排序口令:sort变量名例如:sortprovinceyear意思为将province按升序排列,然后再根据排好的province数列排year这一列最后,保存
至此,一个变量的前期数据处理就完成了,请如法炮制的处理所有的变量,也就是说每个变量都做一个dta文件
在处理新变量前请使用口令:clear将stata重置步骤四:合并数据任意打开一个处理过的变量的dta文件作为基础表(推荐使用因变量的dta文件,这里使用so2作为因变量)口令:merge样本名时间using文件路径例如:mer