Page 25 - 社科学术研究入门及经验
P. 25
好,那么今日重点来了(敲黑板~),假如我决定做empirical research, 我要如何collect
data呢?总结起来答案如下图:
如果你觉得secondary data 就可以回答你的研究问题,那就是说你所需要的data已经
被别人收集好了,你省事了,你想办法把它弄到手然后按照你的需要clean和transform
data 就可以 (请注意是"transform",不是maneuver! )。比如,achival data, 像是
我们研究公共管理的经常可以使用政府之前大规模收集的数据,公开发布的人口调查和抽
样调查,很多研究机构和非盈利组织自己收集和公开供使用的数据,还有许多政府机构会
每年或隔年给自己的员工发问卷,了解公务员的需求和工作状态。这些数据设计和收集的
时候可能不是为了research的目的,至少不是以你的research为目的,但是它恰好能够
为你所用,帮助你解答你的研究问题,这岂不是好?secondary data正是因为不是为了
你的研究问题专门设计的,所以经常会有许多局限性,比如我们并不知道当时这些数据收
集的时候那些收集的人靠不靠谱有没有弄错数据,有的时候有的dataset会提供data
collection和sampling过程详细的描述,而许多dataset 并没有。还有,如果使用的
secondary data是定量的,还需要找到一个叫codebook的东西,因为data variable在
数据库里经常是使用缩写的,只有当时收集和清理数据的人知道那些所写具体是指代什么
变量,codebook就是为variable解密的,告诉你当时具体问的是什么问题,有没有经过
transform, 如何得到的这些数据。