薪资调查一,调查背景英才薪资调查排除不合理数据方法说明:我们对不符合逻辑规则的数据做相应的处理,以保证数据的有效性
所有的逻辑规则按照序号由小到大执行;如果某个纪录中含有多个逻辑错误,那么,它将被序号最小的规则所处理
例子:某纪录中年薪大于月薪的100倍,而且月薪小于200元(规则5、8),那么它将由规则5来处理
规则序号逻辑错误类别本期发生记录数(条)1对本期数据按照E-mail地址排序,相同E-mail地址的数据只保留最早的一条记录,删除其余重复记录2162未满一八岁就已工作773前一职位薪资大于现职位薪资的10倍一三4现职位薪资大于前一职位的50倍235年薪大于月薪的100倍446工龄一年以下,但年薪超过240000(上期99%分位点)477北京地区月薪少于260元一三8其他地区月薪小于200元299年薪高于240000元(上期99%分位点值),工龄少于5年10610本科学历以上,但年薪少于6000元一五311有过海外经历,但年薪少于10000元7612年薪高于240000元,工作单位性质为'政府机关'3一三行业累计任职时间1年以下,年薪超过240000(上期99%分位点)9114薪资各位数数字相同,如1111110一五行业涂鸦(如“什么也不是”)333总计1224排除非研究范围数据类别本期发生数(条)(1)职业类别为'学生/无工作/下岗’284(2)行业为'学生/无工作/下岗’126经过数据的探索阶段,提出不合理数据1634条,得到符合研究范围的合理数据为37564条记录
参与薪资调查情况(城市)本次调查参加者主要集中在北京(21%)、上海(16%)、广州(11%)、深圳(7%)、成都(3%)、杭州(3%)以及东莞(3%),这几个城市的参加者一共占参加调查总人数的64%以上;其他地区参加者则比较分散
其中,北京、上海、广州三大