你到都发发企业名录网去看看,不要花冤枉钱,她们是各类名录下载网站,你免费注册个会员就可以下载了,我经常去她那里下载,我知道的,呵呵,全国各行业的数据都有,她们数据比较新的,升级VIP会员可以下载更精准的数据,如果网上找不到,你可以联系她们客服,你直接到官方网站:你也可以百渡一下:都发发企业名录网
中国工业企业数据已成为国内外学者研究中国企业行为和绩效的主要数据之一,但是这个数据库处理起来并不容易。在正式开始之前,我们必须清楚两个概念:1、脱敏数据:所谓脱敏之后的工业企业数据,就是指这份工业企业数据每个企业的名称、地址、电话等敏感信息已经剔除;
2、序贯匹配:将不同年份的未脱敏数据合并为一份面板数据时,需要每家企业具有唯一的企业标识码,序贯匹配的方法可以为每家企业生成唯一的标识码(除序贯匹配外还有聂辉华(2012)交叉匹配法,本文主要以序贯匹配法为例);
有了上述两个概念之后,就可以将我们获取的工业企业数据分为以下三种类型:
1、经过序贯匹配之后的未脱敏数据
2、经过序贯匹配之后的脱敏数据
3、未经过序贯匹配的未脱敏数据
首先是 经过序贯匹配之后的未脱敏数据(获取这类数据的渠道包括:EPS、中国工业企业数据查询系统),这一类型的数据未脱敏,因此可以与污染、创新、海关等数据库匹配使用,但由于数据商并没有提供序贯匹配的代码和详细方法,因此序贯匹配过程是一个黑洞;
其次是 经过序贯匹配之后的脱敏数据( 获取这类数据的渠道包括:RESSET),这一类型的数据脱敏,因此不可以与其他数据库匹配使用,并且序贯匹配过程是一个黑洞;
最后是 未经过序贯匹配的未脱敏数据(获取这类数据的渠道包括:不详 高校老师可能有),这一类型的数据未脱敏,因此可以与其他数据库匹配使用,并且这一类型数据并没有经过序贯匹配的方法为每家企业生成唯一的标识码,因此可以自己参考Brandt et al.(2012)等方法进行匹配,避免序贯匹配过程的黑洞;
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)