【注】本文数据泉源 于公众号:Paper数据分析
变量阐明
数听说 明
数据区间:2000-2022年(注:股权性子 从2004年开始,第一大股东持股比例从2003年开始)数据对象:全部A股 ,不包罗 已退市的上市公司,不包罗 上市从前 的数据(具体 也可以在代码里修改)
数据格式:excel和dta格式, dta格式必要 Stata 14/15/16/17版本打开
结果 阐明
数据截图
包罗 底子 数据变量
在Stata里已设置好标签 ,方便查察 字段的意义
各变量缺失环境 (mdesc下令 )
剔除金融行业剔除ST类样本并缩尾后形貌 性统计(缩尾下令 winsor2)
附件下载
结果 包罗 几个版本(满意 差别 人需求):
版本1:未剔除金融行业、ST、*ST或PT上市公司样本,未做缩尾处理 惩罚 版本2:剔除金融行业 、ST、*ST或PT上市公司样本,未做缩尾处理 惩罚 版本3:剔除金融行业、ST 、*ST或PT上市公司样本 ,已做缩尾处理 惩罚
数据均未剔除缺失值,选择本身 必要 的变量后再剔除缺失值