引用本文: 林秀芳, 蒋佼佼, 杨茗, 罗理, 郝秋奎, 董碧蓉. 老年失能评估量表简明版本的编制. 中国循证医学杂志, 2017, 17(8): 910-914. doi: 10.7507/1672-2531.201703082 复制
根据世界卫生组织(World Health Organization,WHO)制定的《国际功能分类》(international classification of function,ICF)对失能的定义,失能是包括功能受损、活动受限及社会功能受限在内的总括性术语。失能是老年人常见的综合征,不仅影响老年人的生活质量,也给家庭和社会带来沉重的负担。目前专门针对老年人设计的失能量表较少,本课题组于 2013 年编制的“老年失能评估量表”(elderly disability assessment scale,EDAS)是国内第一个依据 ICF 理论框架并基于中国老年人群调查数据编制的、专门用于老年失能评估量表[1, 2]。我们的前期研究显示其具有良好的信度、效度、可行性和反应度[3, 4]。不同研究者使用该量表对社区和住院老年人群进行的调查显示,该量表比常用的日常生活活动能力量表(activities of daily living scale,ADL)具有更高的敏感性[5, 6]。
EDAS 量表包含 7 个维度,共 28 个条目,虽然评估内容全面,但较为冗长。在针对社区老人的调查中,我们发现使用 EDAS 量表耗时较长,这成为量表使用的主要障碍。国际上许多成熟的量表都需要不断简化以适应不同调查人群的需要,例如:WOHQOL-100 简化为 WHOQOL-BRIF;SF-36 简化为 SF-8 等[7]。因此,本研究以 EDAS 量表为基础,旨在开发更适用于社区老年人群的 EDAS 量表简明版本(elderly disability assessment scale- short form version,EDAS-SF)。
1 资料与方法
1.1 调查资料来源
采用本课题组于 2011 年 10 月~2012 年 8 月采集的社区调查数据,调查地点为四川省遂宁市 5 个农村社区和成都市 3 个城市社区。
1.1.1 纳入与排除标准 纳入标准:年龄≥60 岁的老年人。排除标准:重度认知功能受损;无法通过书写或语言交流;严重精神障碍性疾病;严重基础疾病以致无法完成本研究;其他原因导致受试者不愿或不能参与本研究。
1.1.2 调查方式和内容 调查方式为面对面访谈形式,由经过培训的调查员询问受试者,并根据回答进行评分。调查内容为一般人口学特征和 EDAS 量表。
1.1.3 伦理要求 在调查前对所有受试者说明本研究的目的和意义,保证对资料保密。所有被调查者均签署知情同意书。
1.2 研究方法
随机选择 2/3 受调查者作为训练样本,另 1/3 受调查者作为考核样本。采用 5 种经典统计学方法筛选条目,根据每种方法的统计学结果提出符合要求的条目,然后汇总。每个维度选出被提名次数最多的一个条目,最终形成包含有 7 个条目的 EDAS-SF。
1.2.1 专家重要性评分法 该方法是从重要性和确定性方面筛选条目。由 28 位老年医学和康复医学专家独立对 EDAS 量表的各个条目根据重要程度进行评分(5 分制),计算每个条目的平均分,每个维度中得分最高的条目可认为符合提名要求(若同一维度中的不同条目获得最高分相同则同时纳入)。另外,专家还对 EDAS-SF 的计分方法进行了选择。
1.2.2 离散趋势法 该方法是从条目的敏感性角度来筛选条目。一般来讲,如果条目的离散程度高,用于评价时区别能力就高。因大部分量表采用计分方法,得到的分值多服从正态分布,通常采用标准差来反映离散趋势[7]。本研究选择每个维度中标准差最大的条目作为提名条目。
1.2.3 克朗巴赫系数(Cronbach’s α)法 该方法是从内部一致性角度筛选条目。首先计算某一维度的总克朗巴赫系数,然后与去掉其中任一条目后的克朗巴赫系数进行比较,如果去掉某条目后克朗巴赫系数有较大上升,说明该条目的存在降低了该维度内部一致性,应删除,而保留其余项目[7]。
1.2.4 相关系数法 该方法是从独立性和代表性的角度筛选条目。计算每个条目与各维度的相关系数并作统计检验,保留与其所在维度相关性高的条目。本研究计算每个条目与所属维度的 Spearman 相关系数,并选择每个维度所含条目中 Spearman 相关系数最大者作为提名条目。
1.2.5 探索性因子分析法 该方法是从代表性角度筛选条目。通过对整个量表所有条目进行探索性因子分析,计算因子负荷,考虑各因子主要由哪些条目决定。因子负荷越大表示该条目对所属维度的重要性越大。在进行探索性因子分析前,使用 KMO 检验和 Bartlett 球形检验以明确样本数据是否适用进行探索性因子分析。本研究采用主成分分析法进行因子分析,选择每个维度中因子负荷最大的条目作为提名条目。
此外,本研究还利用考核样本的数据对编制的 EDAS-SF 进行评估。采用克朗巴赫系数评估 EDAS-SF 的内在信度。采用验证性因子分析评估 EDAS-SF 的结构效度,若卡方自由度比值(χ2/df)<5,近似误差均方根(RMSEA)<0.08,比较拟合指数(CFI)、对拟合指数(RFI)、增殖拟合指数(IFI)均>0.9,说明理论模型与实测数据拟合较好,量表具有较好的结构效度。
1.3 统计分析
应用 Epi Data 3.02 软件对数据进行双人双录入,经核查无误后进行统计分析。因子分析采用 AMOS 21.0 软件,其余统计分析采用 SPSS 21.0 软件。对于服从正态分布的计量资料,以均数±标准差进行描述;对于不服从正态分布的计量资料,以中位数和四分位数间距进行描述;对于计数资料采用构成比描述。对于符合正态分布的计量资料,两组间比较采用两独立样本 t 检验;对于不符合正态分布的计量资料,两组间比较采用两独立样本秩和检验;计数资料的组间比较采用卡方检验。所有统计分析结果的检验水准为 α=0.05。
2 结果
2.1 纳入研究人群的基本特征
共调查 916 名受试者,回收有效问卷 887 份,问卷回收率为 96.8%。回收的有效问卷中 554 份来自农村社区老人,333 份来自城市社区老人;男性 382 人,女性 505 人。受试者平均年龄为 70.8±6.9 岁。随机选择 2/3 受试者(592 人)作为训练样本;其余 1/3(295 人)作为考核样本。两个样本人群在社会人口学特征及 EDAS 量表各维度得分方面差异无统计学意义,两个样本人群具有可比性(表 1)。

2.2 条目筛选结果
2.2.1 专家评分法结果 共有 28 位专家填写了完整的调查问卷。专家对所有条目重要性评分的总协同系数为 0.63(P=0.01),说明专家对条目重要性评估的一致性程度较高(表 2)。选取各维度中得分最高的条目作为提名条目,分别是 JS1、QG2、QG3、JL2、HD2、ZL1、ZL3、ZL5、JT2 和 SH1。
2.2.2 离散趋势法结果 EDAS 原始量表各条目得分的标准差见表 2,选取各维度中标准差最大者作为提名条目,分别是 JS3、QG1、JL1、HD6、ZL8、JT2 和 SH1。
2.2.3 克朗巴赫系数法结果 表 2 提供了各维度总克朗巴赫系数,以及删除某个条目后对应的克朗巴赫系数值。提名条目分别是 JS1、JS2、JS3、QG2、QG3、JL2、HD2、HD3、HD6、ZL1、ZL2、ZL3、ZL4、ZL6、JT2 和 SH2。
2.2.4 相关系数法结果 EDAS 原始量表各条目的 Spearman 相关系数见表 2,选取各维度中 Spearman 相关系数最大的条目作为提名条目,分别是 JS1、QG2、JL1、HD2、ZL1、JT2 和 SH1。
2.2.5 探索性因子分析法结果 本研究使用的训练样本为 592 例受试者,超过条目数的 5 倍;KMO 值=0.917,大于 0.9;Bartlett 的球形度检验 P<0.01,说明条目变量间的关系极佳,适合进行探索性因子分析。各条目的因子负荷量见表 2。选择各维度中因子负荷量最高的条目作为提名条目,分别是 JS1、QG2、JL2、HD4、ZL1、JT2 和 SH3。

2.3 编制 EDAS-SF
通过上述方法筛选条目以后,汇总每个维度中被提名次数最多的条目,形成 EDAS-SF,见表 3。EDAS-SF 共包含 7 个条目。通过专家投票,选择 Likert 4 点评分法对条目进行量化。0 分表示受试者无法完成该条目;1 分表示受试者在他人帮助下可完成该条目;2 分表示受试者完成该条目需要借助辅助设备或者借助药物(如:轮椅、拐杖、假肢、通便药物等);3 分表示受试者可独立完成该条目。各条目得分相加即得量表总分。根据总分的高低可划分失能的严重程度:0~6 分提示重度失能;7~13 分提示中度失能;14~20 分提示轻度失能,21 分提示无失能。

2.4 EDAS-SF 信效度考核
利用考核样本分别对 EDAS-SF 量表和 EDAS 原始量表进行信效度评估。EDAS-SF 量表总克朗巴赫系数为 0.836,各维度(除“经济和社会功能”和“交流”维度外)的克朗巴赫系数均大于 0.8,表明 EDAS-SF 量表具有良好的内在信度(表 4)。EDAS-SF 量表的理论模型与 EDAS 量表相同。通过验证性因子分析,χ2/df=3.067,CFI=0.911,RFI=0.932,IFI=0.935,RMSEA=0.020,提示该理论模型与实测数据拟合良好,说明 EDAS-SF 量表具有良好的结构效度。

3 讨论
本研究基于 EDAS 原始量表,应用社区老年人群的样本数据和专家调查结果,编制了包含 7 个条目的 EDAS-SF 量表,并通过考核样本初步验证了 EDAS-SF 量表具有较好的内在信度和结构效度。EDAS-SF 量表主要考察了与老年人功能相关的 7 个方面的核心信息,与 EDAS 量表比较更加简明扼要,耗时更少,有助于提高受试者的依次性,减少实施难度,更适合社区老年人群进行失能评估。
编制简短版量表有许多种不同方法,其筛选条目的角度和侧重点各异,这些方法也有各自的优缺点[8]。本研究综合采用了多种筛选方法,以保证筛选条目的代表性好、独立性强、敏感性高,确保 EDAS-SF 本身仍然是具有良好信度和效度的工具。
本研究局限性:首先,本研究的量表条目筛选和质量评价均基于经典测量理论(classical test theory,CTT)。CTT 是量表编制领域应用最为广泛的理论,但其本身存在一些无法规避的固有缺陷。例如:CTT 所采用的指标具有样本依赖性,其统计量受样本的抽样影响很大;CTT 以一个相同的测量标准误差作为每位受试者的测量误差指标,忽视了受试者能力的个体差异[9]。而新近提出的项目反应理论(item response theory,IRT)则避免了 CTT 的上述不足[10-13]。但由于失能是一个多维的概念,而且不同条目之间可能存在内在联系,因此本研究并未采用 IRT 方法来筛选条目,故可能存在 CTT 方法的固有缺陷。其次,本研究仅考核了 EDAS-SF 量表的结构效度,而 EDAS-SF 量表的重测信度、分半信度、效标关联效度,以及 EDAS-SF 与 EDAS 测量结果的一致性比较,尚待进一步研究验证。第三,EDAS-SF 是基于社区老人数据建立的,该量表是否适用于住院老人和养老机构老人还需要更多研究验证。
综上所述,本研究基于社区老人调查数据和专家调查结果,编制了老年失能评估量表简明版本(EDAS-SF),并初步验证其对于社区老年人群具有良好的内在信度和结构效度。
根据世界卫生组织(World Health Organization,WHO)制定的《国际功能分类》(international classification of function,ICF)对失能的定义,失能是包括功能受损、活动受限及社会功能受限在内的总括性术语。失能是老年人常见的综合征,不仅影响老年人的生活质量,也给家庭和社会带来沉重的负担。目前专门针对老年人设计的失能量表较少,本课题组于 2013 年编制的“老年失能评估量表”(elderly disability assessment scale,EDAS)是国内第一个依据 ICF 理论框架并基于中国老年人群调查数据编制的、专门用于老年失能评估量表[1, 2]。我们的前期研究显示其具有良好的信度、效度、可行性和反应度[3, 4]。不同研究者使用该量表对社区和住院老年人群进行的调查显示,该量表比常用的日常生活活动能力量表(activities of daily living scale,ADL)具有更高的敏感性[5, 6]。
EDAS 量表包含 7 个维度,共 28 个条目,虽然评估内容全面,但较为冗长。在针对社区老人的调查中,我们发现使用 EDAS 量表耗时较长,这成为量表使用的主要障碍。国际上许多成熟的量表都需要不断简化以适应不同调查人群的需要,例如:WOHQOL-100 简化为 WHOQOL-BRIF;SF-36 简化为 SF-8 等[7]。因此,本研究以 EDAS 量表为基础,旨在开发更适用于社区老年人群的 EDAS 量表简明版本(elderly disability assessment scale- short form version,EDAS-SF)。
1 资料与方法
1.1 调查资料来源
采用本课题组于 2011 年 10 月~2012 年 8 月采集的社区调查数据,调查地点为四川省遂宁市 5 个农村社区和成都市 3 个城市社区。
1.1.1 纳入与排除标准 纳入标准:年龄≥60 岁的老年人。排除标准:重度认知功能受损;无法通过书写或语言交流;严重精神障碍性疾病;严重基础疾病以致无法完成本研究;其他原因导致受试者不愿或不能参与本研究。
1.1.2 调查方式和内容 调查方式为面对面访谈形式,由经过培训的调查员询问受试者,并根据回答进行评分。调查内容为一般人口学特征和 EDAS 量表。
1.1.3 伦理要求 在调查前对所有受试者说明本研究的目的和意义,保证对资料保密。所有被调查者均签署知情同意书。
1.2 研究方法
随机选择 2/3 受调查者作为训练样本,另 1/3 受调查者作为考核样本。采用 5 种经典统计学方法筛选条目,根据每种方法的统计学结果提出符合要求的条目,然后汇总。每个维度选出被提名次数最多的一个条目,最终形成包含有 7 个条目的 EDAS-SF。
1.2.1 专家重要性评分法 该方法是从重要性和确定性方面筛选条目。由 28 位老年医学和康复医学专家独立对 EDAS 量表的各个条目根据重要程度进行评分(5 分制),计算每个条目的平均分,每个维度中得分最高的条目可认为符合提名要求(若同一维度中的不同条目获得最高分相同则同时纳入)。另外,专家还对 EDAS-SF 的计分方法进行了选择。
1.2.2 离散趋势法 该方法是从条目的敏感性角度来筛选条目。一般来讲,如果条目的离散程度高,用于评价时区别能力就高。因大部分量表采用计分方法,得到的分值多服从正态分布,通常采用标准差来反映离散趋势[7]。本研究选择每个维度中标准差最大的条目作为提名条目。
1.2.3 克朗巴赫系数(Cronbach’s α)法 该方法是从内部一致性角度筛选条目。首先计算某一维度的总克朗巴赫系数,然后与去掉其中任一条目后的克朗巴赫系数进行比较,如果去掉某条目后克朗巴赫系数有较大上升,说明该条目的存在降低了该维度内部一致性,应删除,而保留其余项目[7]。
1.2.4 相关系数法 该方法是从独立性和代表性的角度筛选条目。计算每个条目与各维度的相关系数并作统计检验,保留与其所在维度相关性高的条目。本研究计算每个条目与所属维度的 Spearman 相关系数,并选择每个维度所含条目中 Spearman 相关系数最大者作为提名条目。
1.2.5 探索性因子分析法 该方法是从代表性角度筛选条目。通过对整个量表所有条目进行探索性因子分析,计算因子负荷,考虑各因子主要由哪些条目决定。因子负荷越大表示该条目对所属维度的重要性越大。在进行探索性因子分析前,使用 KMO 检验和 Bartlett 球形检验以明确样本数据是否适用进行探索性因子分析。本研究采用主成分分析法进行因子分析,选择每个维度中因子负荷最大的条目作为提名条目。
此外,本研究还利用考核样本的数据对编制的 EDAS-SF 进行评估。采用克朗巴赫系数评估 EDAS-SF 的内在信度。采用验证性因子分析评估 EDAS-SF 的结构效度,若卡方自由度比值(χ2/df)<5,近似误差均方根(RMSEA)<0.08,比较拟合指数(CFI)、对拟合指数(RFI)、增殖拟合指数(IFI)均>0.9,说明理论模型与实测数据拟合较好,量表具有较好的结构效度。
1.3 统计分析
应用 Epi Data 3.02 软件对数据进行双人双录入,经核查无误后进行统计分析。因子分析采用 AMOS 21.0 软件,其余统计分析采用 SPSS 21.0 软件。对于服从正态分布的计量资料,以均数±标准差进行描述;对于不服从正态分布的计量资料,以中位数和四分位数间距进行描述;对于计数资料采用构成比描述。对于符合正态分布的计量资料,两组间比较采用两独立样本 t 检验;对于不符合正态分布的计量资料,两组间比较采用两独立样本秩和检验;计数资料的组间比较采用卡方检验。所有统计分析结果的检验水准为 α=0.05。
2 结果
2.1 纳入研究人群的基本特征
共调查 916 名受试者,回收有效问卷 887 份,问卷回收率为 96.8%。回收的有效问卷中 554 份来自农村社区老人,333 份来自城市社区老人;男性 382 人,女性 505 人。受试者平均年龄为 70.8±6.9 岁。随机选择 2/3 受试者(592 人)作为训练样本;其余 1/3(295 人)作为考核样本。两个样本人群在社会人口学特征及 EDAS 量表各维度得分方面差异无统计学意义,两个样本人群具有可比性(表 1)。

2.2 条目筛选结果
2.2.1 专家评分法结果 共有 28 位专家填写了完整的调查问卷。专家对所有条目重要性评分的总协同系数为 0.63(P=0.01),说明专家对条目重要性评估的一致性程度较高(表 2)。选取各维度中得分最高的条目作为提名条目,分别是 JS1、QG2、QG3、JL2、HD2、ZL1、ZL3、ZL5、JT2 和 SH1。
2.2.2 离散趋势法结果 EDAS 原始量表各条目得分的标准差见表 2,选取各维度中标准差最大者作为提名条目,分别是 JS3、QG1、JL1、HD6、ZL8、JT2 和 SH1。
2.2.3 克朗巴赫系数法结果 表 2 提供了各维度总克朗巴赫系数,以及删除某个条目后对应的克朗巴赫系数值。提名条目分别是 JS1、JS2、JS3、QG2、QG3、JL2、HD2、HD3、HD6、ZL1、ZL2、ZL3、ZL4、ZL6、JT2 和 SH2。
2.2.4 相关系数法结果 EDAS 原始量表各条目的 Spearman 相关系数见表 2,选取各维度中 Spearman 相关系数最大的条目作为提名条目,分别是 JS1、QG2、JL1、HD2、ZL1、JT2 和 SH1。
2.2.5 探索性因子分析法结果 本研究使用的训练样本为 592 例受试者,超过条目数的 5 倍;KMO 值=0.917,大于 0.9;Bartlett 的球形度检验 P<0.01,说明条目变量间的关系极佳,适合进行探索性因子分析。各条目的因子负荷量见表 2。选择各维度中因子负荷量最高的条目作为提名条目,分别是 JS1、QG2、JL2、HD4、ZL1、JT2 和 SH3。

2.3 编制 EDAS-SF
通过上述方法筛选条目以后,汇总每个维度中被提名次数最多的条目,形成 EDAS-SF,见表 3。EDAS-SF 共包含 7 个条目。通过专家投票,选择 Likert 4 点评分法对条目进行量化。0 分表示受试者无法完成该条目;1 分表示受试者在他人帮助下可完成该条目;2 分表示受试者完成该条目需要借助辅助设备或者借助药物(如:轮椅、拐杖、假肢、通便药物等);3 分表示受试者可独立完成该条目。各条目得分相加即得量表总分。根据总分的高低可划分失能的严重程度:0~6 分提示重度失能;7~13 分提示中度失能;14~20 分提示轻度失能,21 分提示无失能。

2.4 EDAS-SF 信效度考核
利用考核样本分别对 EDAS-SF 量表和 EDAS 原始量表进行信效度评估。EDAS-SF 量表总克朗巴赫系数为 0.836,各维度(除“经济和社会功能”和“交流”维度外)的克朗巴赫系数均大于 0.8,表明 EDAS-SF 量表具有良好的内在信度(表 4)。EDAS-SF 量表的理论模型与 EDAS 量表相同。通过验证性因子分析,χ2/df=3.067,CFI=0.911,RFI=0.932,IFI=0.935,RMSEA=0.020,提示该理论模型与实测数据拟合良好,说明 EDAS-SF 量表具有良好的结构效度。

3 讨论
本研究基于 EDAS 原始量表,应用社区老年人群的样本数据和专家调查结果,编制了包含 7 个条目的 EDAS-SF 量表,并通过考核样本初步验证了 EDAS-SF 量表具有较好的内在信度和结构效度。EDAS-SF 量表主要考察了与老年人功能相关的 7 个方面的核心信息,与 EDAS 量表比较更加简明扼要,耗时更少,有助于提高受试者的依次性,减少实施难度,更适合社区老年人群进行失能评估。
编制简短版量表有许多种不同方法,其筛选条目的角度和侧重点各异,这些方法也有各自的优缺点[8]。本研究综合采用了多种筛选方法,以保证筛选条目的代表性好、独立性强、敏感性高,确保 EDAS-SF 本身仍然是具有良好信度和效度的工具。
本研究局限性:首先,本研究的量表条目筛选和质量评价均基于经典测量理论(classical test theory,CTT)。CTT 是量表编制领域应用最为广泛的理论,但其本身存在一些无法规避的固有缺陷。例如:CTT 所采用的指标具有样本依赖性,其统计量受样本的抽样影响很大;CTT 以一个相同的测量标准误差作为每位受试者的测量误差指标,忽视了受试者能力的个体差异[9]。而新近提出的项目反应理论(item response theory,IRT)则避免了 CTT 的上述不足[10-13]。但由于失能是一个多维的概念,而且不同条目之间可能存在内在联系,因此本研究并未采用 IRT 方法来筛选条目,故可能存在 CTT 方法的固有缺陷。其次,本研究仅考核了 EDAS-SF 量表的结构效度,而 EDAS-SF 量表的重测信度、分半信度、效标关联效度,以及 EDAS-SF 与 EDAS 测量结果的一致性比较,尚待进一步研究验证。第三,EDAS-SF 是基于社区老人数据建立的,该量表是否适用于住院老人和养老机构老人还需要更多研究验证。
综上所述,本研究基于社区老人调查数据和专家调查结果,编制了老年失能评估量表简明版本(EDAS-SF),并初步验证其对于社区老年人群具有良好的内在信度和结构效度。