Page 39 - CASA Bulletin of Anesthesiology 2022; 9(3)-1 (1)
P. 39
Vol. 9, No 3, 2022
应者均由 K 个不同的评估者进行评分。此时我们关注的是这 K 个不同评估者给出的评分是否相
等,以及他们之间评分标准的一致程度。算法上,我们采用评估者之间的方差来解释组内相关系
数,也就是数据中总方差的比例来计算。因此,该组内相关系数比例的值在 0 到 1 之间浮动;当
组内相关系数接近 1 时,我们认为评估者给定的评分完美一致或高度相关,当组内相关系数接近
0 时,我们认为评估者之间的评分不存在一致性。在多数情况下,组内相关系数达到≥0.8,可以
认定这次评估的可靠性较好,存在一定的相关性。
2,选择组内相关系数统计量时需要考虑的三个问题。
统计学上有许多不同的组内相关系数统计量,在选择恰当的统计量去评估总体参数时,主要
需要考虑的是以下三个方面:1. 选择的模型是单向(one-way model)还是双向(two-way model)
模型;2. 采用的是单计数(single measure)还是平均数(average measure); 3. 选择绝对磨合
(absolute agreement)还是多数同意(consistency)。下面来解释以上三个方面。
✔ 单向模式还是双向模式?
当考虑个体效应随机时使用单向(随机)模式,即每个问卷回应者由不同的随机选择的评估者评
分,或每个问卷被一个评估者评分。该模型多用于检验每个被回应的问卷均值全都相等的假设。
双向模式可分别用随机(random)和混合(mixed)两种情况去解释。双向随机模式用于个体效应(由
不同评估者产生的效应) 和条目效应 (由问卷条目内产生的效应) 均随机时选用;双向混合模式则
是当个体效应随机,条目效应固定时选用。
✔ 单计数还是平均数?
单计数和平均数之间只要的区别在于分析的指标。前者的指标为每个评估者的评分,给出单
个评估者评分的可靠性,通常适用于仅有一个评估者的情况下;后者的指标为 K 位评估者评分的
均值,如果想要调查问卷中每个问题多个评估者评分的均值时,则选择平均数。
✔ 绝对磨合还是多数同意?
绝对磨合与多数同意定义的不同在于计算时的分母是否保留列方差(between column
effects),也就是评估者方差。若考虑评估者系统误差,则保留评估者方差,这时我们选用绝对磨
合,用于测量评估者是否给予被调查者相同的绝对评分;若不考虑,则选用多数同意,用于测量
评定者评分是否高度相关。
3,本文中相关例子
在本期选用的文献中,硬膜外波形分析法被用来评估胸段硬膜外导管功能的敏感性,邀请了 3
名独立(设盲)的观察者/评估者在麻醉复苏室对每个患者术后的每一段波形评估分析,采用了基于
P a g e 38 | 63