Page 127 - 社科学术研究入门及经验
P. 127
所谓“测量的等级”,在这里可以简单理解成这个变量的value在多大程度上可以被精准
地量化。
举个例子,不同的词语的表达准确度是不同的,在日常生活里,我们说的每句话,如果仔
细去区分,也都有不同等级的可量化性。比如以下几句:
我下周就把报告交给你。
我下周二把计划交给你。
我下周二下午把计划交给你。
我下周二下午五点去把计划交给你。
很显然最后一句的可量化程度是最高的,因为它最精准, 信息也最丰富。
然而在研究中,我并不一定总需要可量化程度那么高的数据 ——比如我如果调查了
10000个人力资源经理的年龄和他们工资的关系,我可能只需要知道他们是哪一年生的,
不需要具体知道他们是哪个月哪个日子生的。虽然这会致使1970年1月1日和1970年6月
1日出生的两个人被标为一样的年龄(48岁),但是对我来说这个精准度可能就足够了。
于是按照变量的可量化程度,我们通常把变量们分为以下几类(越往后,其可以被精准量
化的程度就越高):
Nominal variable (名义变量): 这类变量的value都是一些没办法排序也没办法
定量的东西,比如以下这些变量: “性别”, “宗教”,“民族“,”专业“, “出生
地”,“国籍“。 这类变量的value一般都不是数字,如果是数字,那也不代表着什么
数字本身的含义。比如“篮球运动员号”这个变量,虽然有的球员是“29”号,有的
是“40”号,这只是为了区分开彼此的“ID” 而已,它不代表29号球员就比40号小或
者能力差,也没什么其他的含义。
Ordinal variable (有序变量): 这类变量的value可以按照一定逻辑进行排序,从
低往高排,或者从高往低排。比如 “一道题困难的程度”(变量值 =不困难,还行,挺
困难),“你对某陈述句的同意程度”(变量值=非常不同意,不同意,中立,同意,非
常同意), “学生的年级”(变量值=一年级,二年级,三年级)——这些变量的
value内容就更丰富了,你看,对于一个normal variable来说,你只能知道它的变
量值是什么,不能知道变量值之间的任何关系;而对于ordinal variable来说,你
已经可以知道它的各个value之间的高低排序了。