引用本文: 张娈, 王洋洋, 王旭, 谢润生, 李肃, 陈耀龙, 李慧. 中国中医药指南与共识的科学性、透明性和适用性评价(2022年). 中国循证医学杂志, 2024, 24(8): 959-966. doi: 10.7507/1672-2531.202311101 复制
临床实践指南旨在帮助临床医生和患者在特定情况下做出恰当的医疗保健决策[1]。高质量指南与共识能有效规范诊疗行为、提高医疗质量以及降低医疗成本[2-5]。制订高质量的中医药指南既是规范临床中医诊疗,提高疾病治疗水平的需要,又是优化医疗服务质量,缓和医患关系紧张的需要,更是中医药现代化、国际化的需要[6-8]。当前中医药指南与共识的制订工作快速发展,截至2022年已累计制订发布近千部指南[9,10]。在数量快速增长的同时,指南与共识的制订情况、质量水平成为当前重点关注问题。
2021年,中华医学会杂志社指南与标准研究中心联合世界卫生组织指南实施与知识转化合作中心,发布了《指南科学性、透明性和适用性评级工具》(scientific, transparent and applicable rankings tool,STAR),包括11个领域、39项条目[11-13]。STAR工作组自2021年起对医学期刊每年发表的中国指南与共识进行STAR综合评价并对其结果进行报道[14,15]。
为评价中医药领域指南与共识的质量及现状,使评价工作更有针对性和专业性,2022年设立STAR中医药专业委员会[16],负责中医药指南与共识的评价工作。中医药专业委员会联合STAR秘书组采用STAR对2022年度医学期刊发表的中医药指南与共识进行评价,以期反映中医药指南与共识的质量及现状,促进指南与共识的质量提升。本文作者皆为中医药专业委员会和STAR秘书组的工作成员,共同承担完成了本次评价工作,现对评价结果进行分析和报告。
1 资料与方法
1.1 纳入与排除标准
纳入标准:① 标题包含“指南”“指引”“推荐意见”“guideline(s)”“recommendation(s)”“共识”“consensus”之一;② 关注临床或公共卫生问题;③ 制订机构为中国单位或牵头人为中国学者;④ 发表在同行评审期刊;⑤ 发表语种为中文或英文;⑥ 公开发表时间为2022年;⑦ 中医药或中西医结合领域的指南与共识。
排除标准:① 重复文献;② 非期刊首发的指南与共识;③ 涉及针灸推拿领域的指南与共识;④ 多期刊或分章节发表(仅保留1篇);⑤ 指南与共识因材料不齐或其他原因退出评级。
1.2 文献检索策略
计算机检索CNKI、WanFang Data、CBM、中华医学期刊网等中文数据库和MEDLINE(PubMed)数据库,收集国内外中医药领域指南与共识,补充检索香港期刊在线、港澳期刊网、澳门期刊论文索引和台湾期刊论文索引网站。限定的检索时间分2次,分别为2022年1月1日至7月31日和2022年1月1日至12月31日。检索词包括:指南、指引、推荐意见、专家意见、专家建议、guideline*、recommendation*、共识、consensus等。
1.3 指南与共识的筛选
由2名人员独立筛选文献并核对。如遇分歧,通过讨论或咨询指导委员会专家解决。筛选获得指南与共识后,通过邮件联系文献通信作者、官方网站和微信平台公示等方式收集STAR要求的补充材料。包括但不限于计划书、利益冲突声明表、检索策略、共识记录和推广传播文件等。
1.4 一致性测试
在正式评价前,中医药专业委员会的评价委员进行预试验以测试委员间的评价一致性。秘书组对一致性测试结果进行ICC检验,ICC值介于0至1,检验水准α=0.05。当ICC<0.40,一致性差;0.40≤ICC<0.60,一致性中等;0.61≤ICC<0.75,一致性良好;0.75≤ICC≤1.00,一致性高[17]。
1.5 指南评价
使用STAR对纳入的指南与共识进行评价。首先2名评价委员各自独立评分,然后交叉核对评价结果,如有分歧通过参照评级规则或咨询秘书组仲裁。依据指南与共识全文以及其补充材料独立判断其是否符合各条目要求,符合的条目赋1分,部分符合(仅部分条目适用)赋0.5分,不符合或条目不适用均赋0分。通过Excel 2019软件计算得分率。条目得分率=条目实际总得分/条目理论最大总分×100%。领域得分率=领域实际总得分/领域理论最大总分×100%。
1.6 质量控制
① 复查:中医药专业委员会对评价结果进行复核。② 监察:STAR工作组抽检25%评价结果,监察评价工作的准确性。③ 秘书组邀请未参与STAR评级工作的外部专家对评级结果进行评审。
1.7 统计分析
以得分率为评价指标,采用描述性分析方法报告指南与共识的总体情况。指南评价:① 各领域与条目得分率;② 中医药指南与全国指南得分率的对比分析;③ 分层分析。以不同发表期刊、制订机构、学科专业、资助类别等为分层因素,进行得分率比较。
共识评价:① 各领域与条目得分率;② 中医药共识与全国共识得分率的对比分析;③ 分层分析。以不同发表期刊、制订机构、学科专业、资助类别等为分层因素,进行得分率比较。
总体情况采用描述性统计分析,并绘制统计图表。统计学分析使用SPSS 17.0软件,显著性检验采用单因素方差分析,两两比较采用LSD检验,检验水准为α=0.05。
2 结果
2.1 总体情况
2.1.1 评价对象
最终纳入2022年度中医药指南与共识130篇,其中指南36篇,共识94篇(筛选过程见附件图1)。
2.1.2 一致性评价结果
一致性ICC值为0.877[95%CI(0.810,0.927)],一致性程度高。
2.1.3 总得分率
评价领域:中医药指南与共识总得分率较高的3个评价领域依次是“推荐意见”“工作组”“资助”;得分率较低的评价领域依次为“计划书”“注册”“其他”;评价条目:指南与共识总得分率较高的3个条目依次为条目8、条目5和条目19,得分率较低的条目依次为条目36、条目6和条目4(表1)。

2.2 指南评价
2.2.1 领域与条目得分率
评价领域:指南得分率较高的3个领域依次是“推荐意见”“证据”“工作组”,得分率较低的评价领域依次为“计划书”“注册”“可及性”;评价条目:指南得分率较高的3个条目依次为条目19、条目5和条目8,得分率较低的条目依次为条目4、条目6和条目36(图1)。
2.2.2 中医药指南与全国指南得分率对比
中医药指南和全国指南得分率最高的领域均为“推荐意见”,最低均为“计划书”。在11个领域中,除“计划书”“可及性”“其他”中医药指南得分率均高于全国指南(图2)。
2.2.3 分层分析
① 发表期刊:以发表期刊为分层因素(发布指南数量≥3且排前4位的杂志),对比各期刊发布指南的得分率。结果显示总得分率由高到低依次为中国中西医结合杂志、中医杂志、其他及世界中医药杂志,差异有统计学意义。各发表期刊在资助、工作组、利益冲突、临床问题、证据、推荐意见、可及性、其他等评价领域的得分率差异有统计学意义(表2)。② 发布机构:以制订机构为分层因素(发布指南数量前4位机构),对比各机构发布指南的得分率。结果显示总得分率由高到低依次为中国中药协会、中华中医药学会、其他、世界中医药学会联合会及中国医师协会,差异有统计学意义。各制订机构在工作组、利益冲突、临床问题、证据、推荐意见、可及性、其他等评价领域差异有统计学意义。③ 学科专业:以学科专业为分层因素(发布指南数量前4位学科专业),对比各学科发布指南的得分率。结果显示总得分率差异无统计学意义。各学科专业在工作组评价领域差异有统计学意义。④ 资助类别:以资助类别为分层因素,对比各资助类别的指南得分率(资助作为分层因素,因此不做评价领域的统计分析)。结果显示总得分率、各评价领域得分率差异均无统计学意义。

2.3 共识
2.3.1 共识领域与条目得分率
评价领域:共识得分率较高的3个领域依次是“推荐意见”“工作组”“资助”,得分率较低的评价领域依次为“计划书”“注册”“其他”;评价条目:共识得分率较高的3个条目依次为条目8、条目19和条目5,得分率较低的条目依次为条目36、条目6和条目14(图1)。
2.3.2 中医药共识与全国共识领域得分率对比
中医药共识和全国共识得分率最高的领域均为“推荐意见”,最低均为“计划书”。在11个领域中,除“资助”与“工作组”领域,中医药共识均低于全国共识(图2)。
2.3.3 分层分析
① 发表期刊:以发表期刊为分层因素(同指南部分),对比各期刊发布共识的得分率。结果显示总得分率由高到低依次为中国中西医结合杂志、中医杂志、其他、中国中西医结合外科杂志及上海中医药杂志,差异有统计学意义。在领域得分率方面,各期刊在注册、计划、利益冲突、证据、共识方法、可及性领域差异有统计学意义(表3)。② 制订机构:以制订机构为分层因素(同指南部分),对比各机构发布共识的得分率。结果显示总得分率由高到低依次为中华中医药学会、共识项目组、中国中西医结合学会、其他及世界中医药学会联合会,差异有统计学意义。在领域得分率方面,各制订机构在注册、计划、共识方法领域差异有统计学意义。③ 学科专业:以学科类别为分层因素(同指南部分),对比各学科发布指南的得分率。结果显示总得分率由高到低依次为妇科、外科、儿科、内科及其他,差异有统计学意义。在领域得分率方面,各学科专业在注册、临床问题、证据领域差异有统计学意义。④ 资助类别:以资助类别为分层因素(同指南部分),对比各资助类别的共识得分率。结果显示总得分率由高到低依次为商业、学/协会、无资助、国家级及省部级,差异有统计学意义。在领域得分率方面,各资助类别在工作组、共识方法、推荐意见领域差异有统计学意义。

3 讨论
3.1 中医药指南与共识的数量与质量持续提高
2022年度共有130篇中医药指南与共识纳入本次评价,是STAR各专科委员会中评价指南与共识数量最多的专科(例:2022年度肿瘤学专科委员会121部,数量排名第2;儿科学76部,排名第3)[14]。提示中医药领域对规范化诊疗工作的重视提高,制订指南与共识的数量呈增长趋势。虽然中医药领域指南与共识发布数量最多,但中医药学科内还包括了各二级学科,还有较大提升空间。
中医药指南总体呈现较高质量水平,总得分率高于全国指南,今后在研制过程中应更加关注“注册”“计划书”“可及性”等领域。中医药共识总得分率低于全国共识,总体质量有较大提升空间,今后在研制过程中应更加关注“计划书”“注册”“其他”等领域。
3.2 中医药指南与共识的质量差异
中医药指南在“工作组”“临床问题”“证据”“推荐意见”领域得分率较高,说明制订过程中重点关注研究团队组建、临床问题的凝练、证据的系统评价和临床决策方案的提出等指南制订的核心内容[18],是指南科学性的重要保障。在“注册”“计划书”“可及性”领域得分率较低,说明尚未对指南的透明性及应用性方面的内容给予充分关注。而且与目前广泛使用的AGREE Ⅱ(appraisal of guidelines for research and evaluation Ⅱ)[19-21]和卫生保健实践指南的报告条目(reporting items for practice guidelines in healthcare,RIGHT)[22-25]等评价工具相比,“注册”“计划书”“可及性”领域是STAR新增的领域,尚未引起指南制订者的重视。
中医药共识在“资助”“工作组”“推荐意见”领域得分率较高,说明在循证证据不充分时制订共识,重点关注研究团队组建、临床决策方案的提出等方面内容。在“注册”“计划书”等领域得分率较低,说明尚未对共识的透明性及应用性方面的内容给予充分关注。
中医药指南的得分率在总体和各评价领域均高于共识,说明指南的科学性、透明性、适用性等方面均显著高于共识。制订指南需要投入较高成本,共识的制订相对简便,笔者建议在资源条件允许的情况下,应将科学性作为研制工作的重要原则。
3.3 中医药指南与共识质量的影响因素
分层分析显示,期刊杂志、制订机构是中医药指南总得分率的影响因素,发表期刊、制订机构、学科专业、资助类别是中医药共识总得分率的影响因素。提示:① 以上影响因素可能在指南与共识的制订和报道过程中产生影响。② 共识制订和报道过程中受外部影响较多,指南制订较为严格,受外部因素影响相对较小。③ 制订和推广中医药指南研制程序与方法标准,可提高行业整体研制水平。
3.4 研究的局限性
本研究基于医学期刊公开发表的指南与共识,因此未纳入未在期刊公开发表的指南与共识,评价对象尚不够充分全面。STAR首次应用于中医药指南与共识的评级,在中医药领域的适用性情况尚需进一步研究。
指南质量评价工具AGREE Ⅱ[19-21]和STAR[12,13]均重视指南制订的科学性和适用性的评估,但侧重点和表述各有不同。两者均重视资助、利益冲突、团队成员信息、证据系统检索、评价、分级、推荐意见形成且推荐意见明确、易识别等方面的内容。AGREE Ⅱ的“范围和目的”领域更加强调指南目的、适用人群的报告,而STAR相似领域(“临床问题”)更强调临床问题收集和遴选方法的设置。AGREE Ⅱ“利益相关者的参与”领域更加强调患者偏好与观点和目标使用者的报告,而STAR相似领域(“工作组”)更强调多学科专家的纳入。AGREE Ⅱ“指南制订的严谨性”领域更加强调外部评审和指南更新的说明,而STAR相似领域(“证据”和“共识方法”)强调文献可追溯性和研究空白领域的报告。AGREE Ⅱ更侧重指南的“应用性”,而STAR更侧重指南的“可及性”。
此外,STAR更加注重指南制订的透明性。STAR增设了“注册”“计划书”领域,这两个领域强调对指南注册信息和计划书的公开获取,体现了STAR对指南制订过程中透明性的重视。同时STAR的11个领域根据指南制订顺序设置,更便于指南制订者在指南制订流程中进行参考。
综上所述,作为医疗指导文件,中医药指南总体质量较高,而中医药共识总体质量偏低。指南与共识制订者需要重视指南与共识制订过程中的薄弱环节,遵循中医(中西医结合)临床实践指南的制订方法,充分论证指南选题、撰写指南计划书并注册、进行利益冲突声明以提高指南制订的透明化[26];遴选重要的临床问题并构建PICO、系统获取临床证据、进行证据质量与推荐分级以提高指南制订的科学性[27];同时,制订时充分考虑、综合患者偏好与价值观、实施应用等相关因素以提高指南的适用性[28]。参考STAR评级表的评级条目,制订出高质量的指南与共识。
致谢 本研究得到STAR秘书处、STAR中医药专业委员会、STAR针灸推拿专业委员会参与此次评价工作的全体人员支持,一并致谢。
临床实践指南旨在帮助临床医生和患者在特定情况下做出恰当的医疗保健决策[1]。高质量指南与共识能有效规范诊疗行为、提高医疗质量以及降低医疗成本[2-5]。制订高质量的中医药指南既是规范临床中医诊疗,提高疾病治疗水平的需要,又是优化医疗服务质量,缓和医患关系紧张的需要,更是中医药现代化、国际化的需要[6-8]。当前中医药指南与共识的制订工作快速发展,截至2022年已累计制订发布近千部指南[9,10]。在数量快速增长的同时,指南与共识的制订情况、质量水平成为当前重点关注问题。
2021年,中华医学会杂志社指南与标准研究中心联合世界卫生组织指南实施与知识转化合作中心,发布了《指南科学性、透明性和适用性评级工具》(scientific, transparent and applicable rankings tool,STAR),包括11个领域、39项条目[11-13]。STAR工作组自2021年起对医学期刊每年发表的中国指南与共识进行STAR综合评价并对其结果进行报道[14,15]。
为评价中医药领域指南与共识的质量及现状,使评价工作更有针对性和专业性,2022年设立STAR中医药专业委员会[16],负责中医药指南与共识的评价工作。中医药专业委员会联合STAR秘书组采用STAR对2022年度医学期刊发表的中医药指南与共识进行评价,以期反映中医药指南与共识的质量及现状,促进指南与共识的质量提升。本文作者皆为中医药专业委员会和STAR秘书组的工作成员,共同承担完成了本次评价工作,现对评价结果进行分析和报告。
1 资料与方法
1.1 纳入与排除标准
纳入标准:① 标题包含“指南”“指引”“推荐意见”“guideline(s)”“recommendation(s)”“共识”“consensus”之一;② 关注临床或公共卫生问题;③ 制订机构为中国单位或牵头人为中国学者;④ 发表在同行评审期刊;⑤ 发表语种为中文或英文;⑥ 公开发表时间为2022年;⑦ 中医药或中西医结合领域的指南与共识。
排除标准:① 重复文献;② 非期刊首发的指南与共识;③ 涉及针灸推拿领域的指南与共识;④ 多期刊或分章节发表(仅保留1篇);⑤ 指南与共识因材料不齐或其他原因退出评级。
1.2 文献检索策略
计算机检索CNKI、WanFang Data、CBM、中华医学期刊网等中文数据库和MEDLINE(PubMed)数据库,收集国内外中医药领域指南与共识,补充检索香港期刊在线、港澳期刊网、澳门期刊论文索引和台湾期刊论文索引网站。限定的检索时间分2次,分别为2022年1月1日至7月31日和2022年1月1日至12月31日。检索词包括:指南、指引、推荐意见、专家意见、专家建议、guideline*、recommendation*、共识、consensus等。
1.3 指南与共识的筛选
由2名人员独立筛选文献并核对。如遇分歧,通过讨论或咨询指导委员会专家解决。筛选获得指南与共识后,通过邮件联系文献通信作者、官方网站和微信平台公示等方式收集STAR要求的补充材料。包括但不限于计划书、利益冲突声明表、检索策略、共识记录和推广传播文件等。
1.4 一致性测试
在正式评价前,中医药专业委员会的评价委员进行预试验以测试委员间的评价一致性。秘书组对一致性测试结果进行ICC检验,ICC值介于0至1,检验水准α=0.05。当ICC<0.40,一致性差;0.40≤ICC<0.60,一致性中等;0.61≤ICC<0.75,一致性良好;0.75≤ICC≤1.00,一致性高[17]。
1.5 指南评价
使用STAR对纳入的指南与共识进行评价。首先2名评价委员各自独立评分,然后交叉核对评价结果,如有分歧通过参照评级规则或咨询秘书组仲裁。依据指南与共识全文以及其补充材料独立判断其是否符合各条目要求,符合的条目赋1分,部分符合(仅部分条目适用)赋0.5分,不符合或条目不适用均赋0分。通过Excel 2019软件计算得分率。条目得分率=条目实际总得分/条目理论最大总分×100%。领域得分率=领域实际总得分/领域理论最大总分×100%。
1.6 质量控制
① 复查:中医药专业委员会对评价结果进行复核。② 监察:STAR工作组抽检25%评价结果,监察评价工作的准确性。③ 秘书组邀请未参与STAR评级工作的外部专家对评级结果进行评审。
1.7 统计分析
以得分率为评价指标,采用描述性分析方法报告指南与共识的总体情况。指南评价:① 各领域与条目得分率;② 中医药指南与全国指南得分率的对比分析;③ 分层分析。以不同发表期刊、制订机构、学科专业、资助类别等为分层因素,进行得分率比较。
共识评价:① 各领域与条目得分率;② 中医药共识与全国共识得分率的对比分析;③ 分层分析。以不同发表期刊、制订机构、学科专业、资助类别等为分层因素,进行得分率比较。
总体情况采用描述性统计分析,并绘制统计图表。统计学分析使用SPSS 17.0软件,显著性检验采用单因素方差分析,两两比较采用LSD检验,检验水准为α=0.05。
2 结果
2.1 总体情况
2.1.1 评价对象
最终纳入2022年度中医药指南与共识130篇,其中指南36篇,共识94篇(筛选过程见附件图1)。
2.1.2 一致性评价结果
一致性ICC值为0.877[95%CI(0.810,0.927)],一致性程度高。
2.1.3 总得分率
评价领域:中医药指南与共识总得分率较高的3个评价领域依次是“推荐意见”“工作组”“资助”;得分率较低的评价领域依次为“计划书”“注册”“其他”;评价条目:指南与共识总得分率较高的3个条目依次为条目8、条目5和条目19,得分率较低的条目依次为条目36、条目6和条目4(表1)。

2.2 指南评价
2.2.1 领域与条目得分率
评价领域:指南得分率较高的3个领域依次是“推荐意见”“证据”“工作组”,得分率较低的评价领域依次为“计划书”“注册”“可及性”;评价条目:指南得分率较高的3个条目依次为条目19、条目5和条目8,得分率较低的条目依次为条目4、条目6和条目36(图1)。
2.2.2 中医药指南与全国指南得分率对比
中医药指南和全国指南得分率最高的领域均为“推荐意见”,最低均为“计划书”。在11个领域中,除“计划书”“可及性”“其他”中医药指南得分率均高于全国指南(图2)。
2.2.3 分层分析
① 发表期刊:以发表期刊为分层因素(发布指南数量≥3且排前4位的杂志),对比各期刊发布指南的得分率。结果显示总得分率由高到低依次为中国中西医结合杂志、中医杂志、其他及世界中医药杂志,差异有统计学意义。各发表期刊在资助、工作组、利益冲突、临床问题、证据、推荐意见、可及性、其他等评价领域的得分率差异有统计学意义(表2)。② 发布机构:以制订机构为分层因素(发布指南数量前4位机构),对比各机构发布指南的得分率。结果显示总得分率由高到低依次为中国中药协会、中华中医药学会、其他、世界中医药学会联合会及中国医师协会,差异有统计学意义。各制订机构在工作组、利益冲突、临床问题、证据、推荐意见、可及性、其他等评价领域差异有统计学意义。③ 学科专业:以学科专业为分层因素(发布指南数量前4位学科专业),对比各学科发布指南的得分率。结果显示总得分率差异无统计学意义。各学科专业在工作组评价领域差异有统计学意义。④ 资助类别:以资助类别为分层因素,对比各资助类别的指南得分率(资助作为分层因素,因此不做评价领域的统计分析)。结果显示总得分率、各评价领域得分率差异均无统计学意义。

2.3 共识
2.3.1 共识领域与条目得分率
评价领域:共识得分率较高的3个领域依次是“推荐意见”“工作组”“资助”,得分率较低的评价领域依次为“计划书”“注册”“其他”;评价条目:共识得分率较高的3个条目依次为条目8、条目19和条目5,得分率较低的条目依次为条目36、条目6和条目14(图1)。
2.3.2 中医药共识与全国共识领域得分率对比
中医药共识和全国共识得分率最高的领域均为“推荐意见”,最低均为“计划书”。在11个领域中,除“资助”与“工作组”领域,中医药共识均低于全国共识(图2)。
2.3.3 分层分析
① 发表期刊:以发表期刊为分层因素(同指南部分),对比各期刊发布共识的得分率。结果显示总得分率由高到低依次为中国中西医结合杂志、中医杂志、其他、中国中西医结合外科杂志及上海中医药杂志,差异有统计学意义。在领域得分率方面,各期刊在注册、计划、利益冲突、证据、共识方法、可及性领域差异有统计学意义(表3)。② 制订机构:以制订机构为分层因素(同指南部分),对比各机构发布共识的得分率。结果显示总得分率由高到低依次为中华中医药学会、共识项目组、中国中西医结合学会、其他及世界中医药学会联合会,差异有统计学意义。在领域得分率方面,各制订机构在注册、计划、共识方法领域差异有统计学意义。③ 学科专业:以学科类别为分层因素(同指南部分),对比各学科发布指南的得分率。结果显示总得分率由高到低依次为妇科、外科、儿科、内科及其他,差异有统计学意义。在领域得分率方面,各学科专业在注册、临床问题、证据领域差异有统计学意义。④ 资助类别:以资助类别为分层因素(同指南部分),对比各资助类别的共识得分率。结果显示总得分率由高到低依次为商业、学/协会、无资助、国家级及省部级,差异有统计学意义。在领域得分率方面,各资助类别在工作组、共识方法、推荐意见领域差异有统计学意义。

3 讨论
3.1 中医药指南与共识的数量与质量持续提高
2022年度共有130篇中医药指南与共识纳入本次评价,是STAR各专科委员会中评价指南与共识数量最多的专科(例:2022年度肿瘤学专科委员会121部,数量排名第2;儿科学76部,排名第3)[14]。提示中医药领域对规范化诊疗工作的重视提高,制订指南与共识的数量呈增长趋势。虽然中医药领域指南与共识发布数量最多,但中医药学科内还包括了各二级学科,还有较大提升空间。
中医药指南总体呈现较高质量水平,总得分率高于全国指南,今后在研制过程中应更加关注“注册”“计划书”“可及性”等领域。中医药共识总得分率低于全国共识,总体质量有较大提升空间,今后在研制过程中应更加关注“计划书”“注册”“其他”等领域。
3.2 中医药指南与共识的质量差异
中医药指南在“工作组”“临床问题”“证据”“推荐意见”领域得分率较高,说明制订过程中重点关注研究团队组建、临床问题的凝练、证据的系统评价和临床决策方案的提出等指南制订的核心内容[18],是指南科学性的重要保障。在“注册”“计划书”“可及性”领域得分率较低,说明尚未对指南的透明性及应用性方面的内容给予充分关注。而且与目前广泛使用的AGREE Ⅱ(appraisal of guidelines for research and evaluation Ⅱ)[19-21]和卫生保健实践指南的报告条目(reporting items for practice guidelines in healthcare,RIGHT)[22-25]等评价工具相比,“注册”“计划书”“可及性”领域是STAR新增的领域,尚未引起指南制订者的重视。
中医药共识在“资助”“工作组”“推荐意见”领域得分率较高,说明在循证证据不充分时制订共识,重点关注研究团队组建、临床决策方案的提出等方面内容。在“注册”“计划书”等领域得分率较低,说明尚未对共识的透明性及应用性方面的内容给予充分关注。
中医药指南的得分率在总体和各评价领域均高于共识,说明指南的科学性、透明性、适用性等方面均显著高于共识。制订指南需要投入较高成本,共识的制订相对简便,笔者建议在资源条件允许的情况下,应将科学性作为研制工作的重要原则。
3.3 中医药指南与共识质量的影响因素
分层分析显示,期刊杂志、制订机构是中医药指南总得分率的影响因素,发表期刊、制订机构、学科专业、资助类别是中医药共识总得分率的影响因素。提示:① 以上影响因素可能在指南与共识的制订和报道过程中产生影响。② 共识制订和报道过程中受外部影响较多,指南制订较为严格,受外部因素影响相对较小。③ 制订和推广中医药指南研制程序与方法标准,可提高行业整体研制水平。
3.4 研究的局限性
本研究基于医学期刊公开发表的指南与共识,因此未纳入未在期刊公开发表的指南与共识,评价对象尚不够充分全面。STAR首次应用于中医药指南与共识的评级,在中医药领域的适用性情况尚需进一步研究。
指南质量评价工具AGREE Ⅱ[19-21]和STAR[12,13]均重视指南制订的科学性和适用性的评估,但侧重点和表述各有不同。两者均重视资助、利益冲突、团队成员信息、证据系统检索、评价、分级、推荐意见形成且推荐意见明确、易识别等方面的内容。AGREE Ⅱ的“范围和目的”领域更加强调指南目的、适用人群的报告,而STAR相似领域(“临床问题”)更强调临床问题收集和遴选方法的设置。AGREE Ⅱ“利益相关者的参与”领域更加强调患者偏好与观点和目标使用者的报告,而STAR相似领域(“工作组”)更强调多学科专家的纳入。AGREE Ⅱ“指南制订的严谨性”领域更加强调外部评审和指南更新的说明,而STAR相似领域(“证据”和“共识方法”)强调文献可追溯性和研究空白领域的报告。AGREE Ⅱ更侧重指南的“应用性”,而STAR更侧重指南的“可及性”。
此外,STAR更加注重指南制订的透明性。STAR增设了“注册”“计划书”领域,这两个领域强调对指南注册信息和计划书的公开获取,体现了STAR对指南制订过程中透明性的重视。同时STAR的11个领域根据指南制订顺序设置,更便于指南制订者在指南制订流程中进行参考。
综上所述,作为医疗指导文件,中医药指南总体质量较高,而中医药共识总体质量偏低。指南与共识制订者需要重视指南与共识制订过程中的薄弱环节,遵循中医(中西医结合)临床实践指南的制订方法,充分论证指南选题、撰写指南计划书并注册、进行利益冲突声明以提高指南制订的透明化[26];遴选重要的临床问题并构建PICO、系统获取临床证据、进行证据质量与推荐分级以提高指南制订的科学性[27];同时,制订时充分考虑、综合患者偏好与价值观、实施应用等相关因素以提高指南的适用性[28]。参考STAR评级表的评级条目,制订出高质量的指南与共识。
致谢 本研究得到STAR秘书处、STAR中医药专业委员会、STAR针灸推拿专业委员会参与此次评价工作的全体人员支持,一并致谢。