数据和变量1齐鲁工业大学 邵林 本书第二章已经对股权结构、投资和公司绩效的三者相关性的文献进行了详细的回顾,第三章对这一问题又给予了理论上的支持和方法上的指引
为了揭开股权结构、投资和公司绩效三者的之间的真实相关性,本章我们将通过设定相关计量模型,并通过数据调查对三者的相互关系进行进一步的讨论
本章的结构安排如下:首先第一部分给出如何选择本书讨论的样本、阐述数据的来源和选择标准;第二部分的内容主要是变量解释,包括对被解释变量和解释变量的详细解释
第三部分主要对在模型中会出现的控制变量进行描述
第四部分提供了变量的统计性描述
第五部分呈现的是相关性统计
为了检验变量的平稳性问题,第六部分提供了变量的单位根检验过程及其结果
最后是本章小结
1 数据筛选和样本选择本讨论的样本选择参考过去以往讨论者的方法,本书选取样本期 1999 年至2024 年共 14 年期间,在上海证券交易所和深圳证券交易所上市的 350 家上市公司的数据为讨论样本,总体样本数值为 4900 个观测值
本书的讨论选择的数据类型为平行面板数据
在之前的章节谈到,面板数据是处理内生性的一种有效方法,它能够降低来自不可观测的异质性带来的内生性的问题
本书参考之前许多学者的讨论样本(Himmelberg et al
,1999;Chi,2024; Wintoki et al
,2024),选取面板数据作为本书的讨论样本,以减轻不可观测的异质性给股权结构和公司绩效两者相关性带来的可能偏误
同时,对不可观测的异质性问题,我们将考虑使用固定效应模型或随机效应模型去解决这一问题(Arellano & Bover, 1990)
1 不可引用本书的数据来源于以下三个数据库:一是中国经济讨论中心的 CCER 数据库,来自于成都色诺芬信息技术有限公司和北京大学,具体有一般上市公司财务数据库,CCER 上市公司治理结构数据库和 C