在针灸临床研究的腧穴数据挖掘工作中,文献证据质量、样本量、临床疗效等因素对结局质量的影响尚不明确,影响了数据挖掘类研究成果的证据转化与临床应用。本研究提出运用熵权和线性加权法对上述指标进行多指标决策以获得腧穴处方综合权重得分,通过加权腧穴处方进行后续数据挖掘工作的新流程。本文以偏头痛研究为例将加权算法与经典算法结果进行对比,结果显示本研究所提出的算法对选穴分散的研究更具意义,在聚类分析中能更好发现潜在的腧穴配伍规律。该算法将循证针灸学体系纳入数据挖掘工作流程,为针灸学数据挖掘相关研究质量的提升提供了新思路,但后续仍需更多的研究加以验证。
引用本文: 王喆, 陈芊秀, 董志浩, 宋庆雨, 陈新勇, 韩晶. 基于循证体系的针灸学数据挖掘算法构建与应用研究. 中国循证医学杂志, 2024, 24(9): 1070-1078. doi: 10.7507/1672-2531.202309142 复制
在当今大数据时代的背景下,数据挖掘技术在针灸学中得到了广泛实践,成为从针灸文献大数据中获得有效信息、探索隐含知识的重要研究手段[1]。针灸学数据挖掘研究目前广泛应用于腧穴配伍规律、针刺效应、针刺手法等方面。作为其最主要的应用场景—腧穴处方挖掘近年来增长迅速,在明确核心腧穴、探究配伍规律、构建针灸处方等方面发挥了关键作用[2]。针灸数据挖掘是文献学、循证医学、信息科学与针灸学的交叉学科,在实际开展中易受到原始信息质量、数据挖掘算法应用、结果解释等方面的不确定因素的干扰,进而影响研究的严谨性。有学者认为,部分针灸学数据挖掘面临证据来源的问题,基于低质量的原始数据提炼汇总的结论难以对临床实践起到真正的指导作用[3]。此外,有益的挖掘结果来源于高质量的医案与有效的处方,有研究者发现,目前中医药数据挖掘对临床疗效与个案质量重视不足[4]。事实上,目前临床针灸腧穴挖掘研究仅针对研究方案实施前所拟定的腧穴,而忽略了其研究结果的可靠性。正因如此,很长一段时间以来,相关研究成果在临床指南构建中尚未形成规模化、规范化的应用体系。
上述问题的存在呼吁针灸数据挖掘提供新的思路与方案,有学者提出数据挖掘应考虑与循证医学证据联用[5],然而目前尚未有算法实现腧穴挖掘结果和循证医学证据质量的有机整合。因此,如何在数据挖掘过程中充分考虑证据质量等级、临床疗效等诸多因素,进而基于研究质量较高、临床疗效较为明确的腧穴进行系统性挖掘分析,成为针灸数据挖掘算法改进的着眼点。针灸数据挖掘涉及两大核心的算法:关联规则和聚类分析,其中聚类分析又以共现矩阵为基础。随着数据挖掘技术在各领域的推广应用,关联规则衍生出加权关联规则算法[6-8],其充分考虑了项目的权重在数据中的重要性,为发现事务数据中重要项目之间隐藏关系提供了有效方法[9]。共现矩阵则衍生出根据项目权重赋值的加权共现矩阵算法。基于加权体系的算法在包括生物信息学、计算机文本挖掘在内的诸多领域进行了广泛应用[10,11],并在中药处方挖掘中以疗效为权重进行了探索[12,13]。这些新算法的出现,为我们解决针灸腧穴挖掘循证证据整合问题提供了思路。因此,本研究以针刺干预偏头痛研究为例,提出综合考虑证据质量等级和临床疗效的加权数据挖掘算法,以期为针灸数据挖掘研究方法学和中医药证据转化应用提供有益补充。
1 资料与方法
1.1 纳入与排除标准
1.1.1 研究类型
针刺治疗偏头痛的临床研究。
1.1.2 研究对象
偏头痛患者,病例来源、年龄、性别及病程长短不限。
1.1.3 干预措施
试验组采用针刺疗法(针具、选穴、留针时间、疗程等不限),若研究类型包含对照组,则对照组的治疗方法不限。
1.1.4 结局指标
头痛视觉模拟评分(visual analogue scale,VAS)。
1.1.5 排除标准
① 干预措施为针刺联合中西医其他诊疗方案;② 重复发表的文献;③ 无法获取全文或数据不全的文献。
1.2 文献检索策略
计算机检索PubMed、Embase、Web of Science、CBM、WanFang Data、VIP和CNKI数据库,搜集针刺治疗偏头痛的临床研究,检索时限均为2013年1月至2023年8月。检索采用主题词与自由词相结合的方式进行,并根据各数据库特点进行调整。同时检索纳入研究的参考文献,以补充获取相关资料。中文检索词包括:针灸、针刺、电针、体针、头针、偏头痛、头风等;英文检索词包括:acupuncture、migraine、hemicrania等。
1.3 纳入研究的偏倚风险评价
采用复旦大学JBI循证护理合作中心翻译的中文版“JBI干预性研究证据预分级系统[14]”将纳入研究按实验性研究、类实验性研究、观察性-分析性研究、观察性-描述性研究、专家意见划分为1~5级。采用“JBI循证卫生保健中心质量评价工具”对不同类型研究进行质量评价[15-17]。其中,随机对照研究共13分,考虑到针灸操作施术者的盲法难以实施[18],因此“是否对干预者采取了盲法”条目指定为“不适用”,排除该条标准后共12分;类实验研究总分9分;病例报告总分8分。因不同研究条目总分不同,将不同研究类型得分除以总分进行标准化。
1.4 文献筛选与资料提取
由2名研究者独立筛选文献、提取资料并交叉核对。如有分歧,则通过讨论或与第三方协商解决。资料提取内容包括:作者、标题、发表年份、针刺方案、临床疗效指标等。
1.5 多指标决策计算文献综合权重[19 ]
1.5.1 构建决策矩阵
一个多指标决策问题由以下3个要素构成:n个评价指标fj(1≤j≤n)、m个决策方案Ai(1≤i≤m)、1个决策矩阵D=(xij)m×n(1≤i≤m,1≤j≤n),其中元素xij表示第i个方案,第j个指标的值。在本研究中,决策对象Ai为所有纳入数据挖掘研究的文献,决策指标包括:证据等级、文献质量、样本量、治疗前后VAS差值,据此构建决策矩阵。
1.5.2 决策指标赋值及定义
各决策指标按如下规则赋分:证据等级按1~5级分别赋为1~5分;文献质量、样本量、VAS差值为连续型资料,直接纳入后续多指标决策计算。其中“证据等级”定义为成本型指标,即分值越低(证据等级越高)对决策越有利,其余指标均为效益型指标,即分值越高对决策越有利。
1.5.3 标准化决策矩阵
采用线性比例变化法对不同量纲指标进行标准化后,得到的矩阵R=(rij)m×n。
1.5.4 指标权重计算及多指标决策
采用熵值法计算各决策指标权重。熵值法是一种客观赋权法,依据各指标值所包含的信息量的大小来确定指标权重。采用简单线性加权法进行多指标决策,该方法通过计算各评价方案的线性加权和,并以此作为各决策对象的得分依据。
1.6 加权关联规则分析
本研究采用R软件arules包计算关联规则,根据Ayse等提出的加权关联分析算法进行规则加权[6]。该算法由如几下步骤组成:① 设定初始最小支持度;② 运用Eclat算法获得关联规则;③ 计算每个项的平均权重;④ 对于每个规则,根据规则中存在的项的权重计算规则权重(公式1);⑤ 计算规则的加权支持度(weighted support,WSP)(公式2),并进行Min-Max标准化处理;⑥ 根据设定的支持度进一步筛选关联规则,采用加权关联规则算法对支持度进行加权处理。
![]() |
![]() |
其中,为一个项集(item set),
是第k个项集,
为该项集中项的个数,
为第k项关联规则。
1.7 构建加权共现矩阵
在进行复杂网络分析和聚类分析时首先需构建共现矩阵。共现矩阵是一个展现不同类别之间邻接关系的矩阵,而加权共现矩阵使其能够反映邻接类别的重要性。采用R语言for循环嵌套构建共现矩阵,在具体实现中首先对所有纳入的穴位进行去重作为矩阵的行和列,然后遍历每项研究,依次统计每对穴位共同出现在同一研究中的次数,从而构建出表示穴位共现关系的矩阵。在未加权矩阵中所有穴位权重相同,因而每对穴位共同出现1次记为1,而加权共现矩阵中,每对穴位所属处方具有不同权重得分,故每对穴位共同出现1次记为1×处方权重系数。以图1为例,在传统共现矩阵中,有两组处方中共同出现了风池和太阳,故其共现频次为2。在加权共现矩阵中,处方1的权重为0.5,处方3权重为0.7,因而其加权共现频次为1.2。

1.8 复杂网络及聚类分析
运用Gephi 0.1.0对网络进行可视化分析,计算网络的度(degree centrality,DC)、加权度(weighted degree)、接近中心性(closeness centrality,CC)、中介中心性(betweenness centrality,BC)、图密度、模块度等参数,比较加权与加未权矩阵参数区别,根据Modularity的社团划分算法进行聚类分析。根据腧穴共现频次,对高频共现穴对进行筛选,同时对高频腧穴进行层次聚类分析。
2 结果
2.1 文献筛选流程及结果
初检共获得文献4 434篇,包括:PubMed(n=307)、Web of Science(n=372)、Embase(n=243)、CNKI(n=1 082)、WanFang Data(n=746)、VIP(n=563)、CBM(n=1 121),经逐层筛选后,最终纳入117篇文献,包含151条针灸处方,腧穴总频次1 104次。
2.2 纳入研究类型及质量评价结果
纳入研究包含随机对照试验108篇、类实验研究8篇、病例报道1篇。随机对照试验质量评价平均得分8.85±1.52分;类实验研究平均得分5.00±2.20分;病例报道得分为6分。
2.3 熵权法确定各指标权重
采用熵值法确定不同决策指标的权重,按线性比例变化法对不同量纲指标进行标准化,分别计算各指标熵值、偏差度,据此计算各指标最终权重。结果显示,文献类型和文献质量在最终评价中所占权重较低,而样本量、VAS差值所占权重较高,其中又以VAS差值所占比例最高,见表1。

2.4 线性加权法进行多指标决策
根据熵权法所获得的各纳入腧穴处方的权重系数,采用线性加权法计算各纳入研究进行多指标决策,151条处方最终权重得分呈正偏态分布(Skewness=0.521,K-S P=0.029),最低得分为0.173,最高得分为0.752,平均得分为0.428±0.107,得分分布见图2。

2.5 加权频次分析
针刺治疗偏头痛的腧穴处方中,使用频次大于15次的腧穴有20个。基于频次统计和加权频次统计所筛选出的高频腧穴占比一致,累计频率均大于70%。但加权算法对腧穴频次排序产生影响,如足临泣、合谷、头维、百会、角孙、丘墟、三阴交、悬颅、足三里、丰隆、太溪、阿是穴等腧穴的频次排序和加权频次排序存在差异,见图3。

2.6 加权关联规则分析
设置Eclat算法初始支持度为0.1,共获得123条关联规则。对其进行加权、标准化处理后,设定WSP>0.25、置信度>0.8为筛选条件,加权算法共获得26项关联规则,未加权算法获得11项关联规则。在本研究中,较传统未加权算法相比,同等条件下加权算法发现更多关联规则,且不同关联规则间支持度区别更为明显,详见表2。

2.7 复杂网络特征分析
分别构建基于频次的共现矩阵和加权共现矩阵,运用Gephi软件构建复杂网络,共获得132个节点、


2.8 腧穴共现频次分析
腧穴共现频次为复杂网络分析的边权重。选取腧穴共现频次大于30的组合进行对比展示,共筛选出16条穴对组合,加权算法对腧穴共现频次排序存在影响,高频腧穴组合受权重影响较小,而对部分腧穴有较大影响,如太冲-外关组合,见表4。进一步分析结果显示,加权算法对腧穴共现频次影响与腧穴频次呈负相关(Spearman r=−0.961,P<0.001),见图5。


2.9 高频腧穴层次聚类分析
对高频腧穴(频次大于15)进行层次聚类分析,使用欧氏距离计算数据点之间的距离,使用Ward’s方法将数据点分组成簇,进而形成层次结构。结果显示,未加权矩阵与加权矩阵聚类大类基本一致。但未加权聚类的树状图总体高度更高,同时倾向于形成较大的簇,见图6。

3 讨论
针灸数据挖掘原始文献内部特征评价一直是困扰临床针灸数据挖掘类研究的问题,也是该类研究纳入循证针灸学体系的阻碍之一。本研究在国内外数据科学领域相关加权数据挖掘算法的基础上,提出“基于循证体系的针灸学数据挖掘算法”。该算法强调综合考虑原始文献的各种内部特征,采用熵权法对其各决策指标加权最终得到文献的总权重后再行各种数据挖掘分析。本研究以偏头痛为例应用该算法,并将其结果与经典数据挖掘算法进行比较,通过两者结果差异探讨经典算法与加权算法的临床适用性,从而审视既往基于经典数据挖掘算法结论的临床意义。
3.1 多指标决策和熵权法
恰当的决策指标选择是发挥多指标决策优势、进行合理决策的前提。本研究基于目前针灸腧穴挖掘所面临的两大难题—证据质量的模糊性与疗效评价的不确定性出发,参考循证指南构建、系统评价等规范所体现出的证据评估要点,从证据等级、文献质量、样本量、临床疗效4个维度构建综合决策指标。
首先,数据挖掘最终目的是探索出特定疾病潜在组方、组穴思路,而证据质量是给出推荐意见的重要考量因素[20],对证据质量进行分级,并在此基础上结合患者价值观和意愿作出推荐是循证医学最显著的特点[21]。在既往的数据挖掘过程中,文献质量评价通常作为纳入标准出现在研究中,但很少有研究者报告文献质量评价的具体方法和结果。也有研究者在进行数据挖掘分析前构建“证据图”,体现了原始证据质量的重视,但在实际操作中,证据评价和数据挖掘仍是两个独立的部分[4]。数据挖掘工作的特点在于对文献数据的广泛挖掘,过于限制证据质量则会影响文献纳入范围,而纳入研究证据质量过低则会降低数据挖掘的可信度。因此,将证据等级质量纳入多指标决策成为一种可能的解决方案。JBI基于多元主义的哲学观,提出多元化证据体系的来源适用于针灸学科数据挖掘工作的实际需要[14]。因此,本研究选用JBI提出的5级有效性研究证据预分类方案,并采用JBI提供的文献质量评价工具对原始证据质量进行评价。
此外,样本量大小是临床研究设计的重要环节,直接关系到研究结论的可靠性、可重复性,以及研究效率的高低[22]。在一些指南中,样本量作为证据分级或推荐等级的参考指标[23,24]。在针灸学领域,任玉兰等提出的 “针灸临床研究证据评价体系”也将样本量作为研究质量评价的参数[25]。近年来,基于大数据的真实世界研究中医药领域应用场景日益广泛[26],由此带来不同研究间样本量的差异逐渐增大。因而,在针灸学数据挖掘研究质量综合评价过程中,样本量应予以足够的重视。
最后,转化医学的最终目标是提升疗效而使患者获益[27],选择合适的、具有代表性的临床疗效评价指标是把握证据价值的关键。目前,疗效指标作为权重指标在中药处方挖掘中进行了探索性应用,如丁弋美等运用加权关联规则分析对干燥综合征的处方进行挖掘[13]、朱小林运用类似的思路分析了慢性肾脏病的中药配伍[12]。在偏头痛研究中,VAS评分、头痛发作频率、头痛相关生活质量等指标是目前偏头痛临床试验中常选用的指标,其中VAS对针刺的近期疗效反应最为直接,同时可以体现针刺的长期疗效[28]。考虑到多指标存在共线性关系、多指标带来缺失值的增多,本研究最终选用VAS评分作为代表性指标。需要明确的是,辨证论治是中医学科的鲜明特点,不同疾病在不同阶段有着不同的特征及证候规律,分证、分期选择合适的评价指标,并以此为亚组进行高质量的数据挖掘仍是今后数据挖掘工作的方向[29]。
确定测评指标体系的权重是系统测评的基础[30]。指标体系权重的方法一般可分为主观赋值法和客观赋值法两大类,熵值法是客观赋权法的代表,其本质是根据指标所包含的信息量来决定其重要性。熵值法的应用既可最大限度利用数据的特征,与各种主观赋权模型相比,熵值法能够有效避免人为因素对指标权重的干扰,从而增强综合评价结果的客观性[19]。熵权法最终计算结果显示样本量、VAS评分差值是影响指标权重的主要因素,而文献类型、文献质量仅占较小的权重。究其原因,主要是纳入的针刺干预偏头痛临床研究中92.3%为随机对照研究,证据等级为1级,文献质量评价在6~11分之间,证据等级与文献质量在结果呈现上仍为等级资料,导致这两项数据离散性较小,进而所占最终决策权重偏低。我们建议在后续研究中充分考虑文献质量评价的实际情况,若该研究领域文献质量整体较好可选用熵值法进行多指标决策,如文献研究质量差异较大,可通过专家咨询的方式以层次分析等方法确定指标权重。
3.2 加权数据挖掘算法与经典算法结果比较分析
以本研究为例,频次统计和加权频次统计结果对腧穴排序存在影响,但高频腧穴如风池、率谷、太阳、太冲、外关受其影响较小,而中、低频次腧穴则可因加权算法改变其原始顺序。同样的情况也出现在高频腧穴组合的频次差异上,据图3所示,随着腧穴频次逐渐降低,加权与未加权算法对穴对共现频次排序差异度的影响逐渐增大,一方面原因是加权算法对腧穴排序更加精确,减少了同一穴对共现频次相同的情况,而另一方面则由于加权频次是频次和权重二者综合影响的结果,高频穴对排序时频次占绝对优势,而随着频次的降低权重因素的影响逐渐凸显。偏头痛文献选穴较为集中,因而加权和未加权算法对高频数据挖掘结果影响较小,若有研究选穴较为分散,则可能影响基于选穴频次而采取的临床决策。值得注意的是,选穴分散的研究往往更能体现腧穴数据挖掘研究方法的优势和必要性。在关联规则分析中,基于加权关联规则分析算法的结果更能体现腧穴之间关联程度的差异,使得不同穴位关联规则支持度更为显著。
从共现矩阵的网络指标来看,加权共现矩阵具有更低的加权度。度就是一个节点连接边的数量,加权度是考虑边的权重后的总和。加权操作不会影响矩阵节点的共现关系,因此基于节点的指标在两种算法间无明显差异。但是,加权操作影响了边的权重,在原始矩阵中所有边的权重都为1,加权后的矩阵边权重介于0~1之间,具有较低的整体加权度。这表明,在加权矩阵中,信息更加密集,更易突出高质量或疗效较好的穴位。同样,层次聚类分析结果也显示加权矩阵和未加权矩阵聚类结构存在一定差异,加权处理影响了穴位共现矩阵的聚类结构。聚类的“高度”通常与簇内成员之间距离成正比[31]。未加权矩阵的树状图总体上更高,表明形成簇的“距离”更大。因此,未加权的方法倾向于形成更大的簇,而这些簇中包含的成员数目相对较多。加权矩阵产生簇的高度较低,更倾向于形成小簇,其内的成员之间的相似度更高。具体在腧穴处方挖掘中,加权层次聚类分析可能更易发现潜在穴位配伍规律。从聚类结果看,基于复杂网络社团聚类算法的核心处方聚类结果更能体现针灸学选学特点,如:太冲、合谷为四关穴,风池、率谷是胆经头部要穴,外关、丘墟则体现出上下取穴的配伍原则。
综上,在基于频次和关联规则的分析中,加权算法对高频腧穴和关联规则影响较小。数据挖掘的目的在于发现高频条目,因而以往腧穴频次集中研究中经典算法的结论仍然有效,而在选穴较为分散的研究中则更能体现出加权算法基于循证综合评价后的优势。在基于共现矩阵的网络分析、社团聚类分析、层次聚类分析中,两种算法的差异较大,加权后的矩阵信息更加集中,穴位间相似度增加,更有利于发现潜在的腧穴配伍规律。
3.3 加权数据挖掘算法拓展应用
本研究的应用对象为现代临床针灸数据挖掘研究,针灸学数据挖掘技术在古籍挖掘中同样具有广泛应用。目前已有学者针对中医古籍、针灸古籍进行了质量评级工作,可据此作为权重在古籍数据挖掘过程中进行赋权,进而开展基于中医循证体系的古籍数据挖掘工作[32,33]。此外,《中共中央国务院关于促进中医药传承创新发展的意见》指出,“加快构建中医药理论、人用经验和临床试验相结合的中药注册审评证据体系”[34],人用经验目前可作为支持中药注册审评证据体系的关键组成部分[35],目前已有学者提出中医医案临床证据应用与疗效评价体系[36],本研究提出的基于循证体系的加权数据挖掘算法可与名老中医经验挖掘进一步结合应用,以更好促进“人用经验”向“循证证据”转化。
3.4 结语
本研究从循证医学角度出发对传统数据挖掘算法进行了创新,提出了加权数据挖掘算法体系,使得数据挖掘结果综合考虑了原始研究的证据质量与疗效特征,整合了循证针灸学体系和数据挖掘工作流程,提升了数据挖掘结论的质量,增加了数据挖掘所得出的结论的合理性。相较于经典算法,本研究所提出的算法对发现潜在的优势腧穴、探寻腧穴间隐含的配伍关系具有优势。
需要注意的是,不同研究间临床疗效的差异不仅仅是由选穴差异所致,不同研究的针刺方法、电针应用等交互效应对患者的共同影响难以避免。本研究为探索性研究,诸类细节仍需后续多指标决策赋权时进一步优化考虑,如应进一步明确电针的使用、针刺的剂量-反应关系等因素对针刺疗效的影响,考虑就不同疾病分期、证候分型特征等进行更为详细的数据挖掘。在循证医学的背景下,进行针灸学文献研究的过程中原始研究的证据质量评价是所有研究者需谨慎对待的问题,如此才能推进适合针灸学科特色的循证医学体系的进一步完善发展。
在当今大数据时代的背景下,数据挖掘技术在针灸学中得到了广泛实践,成为从针灸文献大数据中获得有效信息、探索隐含知识的重要研究手段[1]。针灸学数据挖掘研究目前广泛应用于腧穴配伍规律、针刺效应、针刺手法等方面。作为其最主要的应用场景—腧穴处方挖掘近年来增长迅速,在明确核心腧穴、探究配伍规律、构建针灸处方等方面发挥了关键作用[2]。针灸数据挖掘是文献学、循证医学、信息科学与针灸学的交叉学科,在实际开展中易受到原始信息质量、数据挖掘算法应用、结果解释等方面的不确定因素的干扰,进而影响研究的严谨性。有学者认为,部分针灸学数据挖掘面临证据来源的问题,基于低质量的原始数据提炼汇总的结论难以对临床实践起到真正的指导作用[3]。此外,有益的挖掘结果来源于高质量的医案与有效的处方,有研究者发现,目前中医药数据挖掘对临床疗效与个案质量重视不足[4]。事实上,目前临床针灸腧穴挖掘研究仅针对研究方案实施前所拟定的腧穴,而忽略了其研究结果的可靠性。正因如此,很长一段时间以来,相关研究成果在临床指南构建中尚未形成规模化、规范化的应用体系。
上述问题的存在呼吁针灸数据挖掘提供新的思路与方案,有学者提出数据挖掘应考虑与循证医学证据联用[5],然而目前尚未有算法实现腧穴挖掘结果和循证医学证据质量的有机整合。因此,如何在数据挖掘过程中充分考虑证据质量等级、临床疗效等诸多因素,进而基于研究质量较高、临床疗效较为明确的腧穴进行系统性挖掘分析,成为针灸数据挖掘算法改进的着眼点。针灸数据挖掘涉及两大核心的算法:关联规则和聚类分析,其中聚类分析又以共现矩阵为基础。随着数据挖掘技术在各领域的推广应用,关联规则衍生出加权关联规则算法[6-8],其充分考虑了项目的权重在数据中的重要性,为发现事务数据中重要项目之间隐藏关系提供了有效方法[9]。共现矩阵则衍生出根据项目权重赋值的加权共现矩阵算法。基于加权体系的算法在包括生物信息学、计算机文本挖掘在内的诸多领域进行了广泛应用[10,11],并在中药处方挖掘中以疗效为权重进行了探索[12,13]。这些新算法的出现,为我们解决针灸腧穴挖掘循证证据整合问题提供了思路。因此,本研究以针刺干预偏头痛研究为例,提出综合考虑证据质量等级和临床疗效的加权数据挖掘算法,以期为针灸数据挖掘研究方法学和中医药证据转化应用提供有益补充。
1 资料与方法
1.1 纳入与排除标准
1.1.1 研究类型
针刺治疗偏头痛的临床研究。
1.1.2 研究对象
偏头痛患者,病例来源、年龄、性别及病程长短不限。
1.1.3 干预措施
试验组采用针刺疗法(针具、选穴、留针时间、疗程等不限),若研究类型包含对照组,则对照组的治疗方法不限。
1.1.4 结局指标
头痛视觉模拟评分(visual analogue scale,VAS)。
1.1.5 排除标准
① 干预措施为针刺联合中西医其他诊疗方案;② 重复发表的文献;③ 无法获取全文或数据不全的文献。
1.2 文献检索策略
计算机检索PubMed、Embase、Web of Science、CBM、WanFang Data、VIP和CNKI数据库,搜集针刺治疗偏头痛的临床研究,检索时限均为2013年1月至2023年8月。检索采用主题词与自由词相结合的方式进行,并根据各数据库特点进行调整。同时检索纳入研究的参考文献,以补充获取相关资料。中文检索词包括:针灸、针刺、电针、体针、头针、偏头痛、头风等;英文检索词包括:acupuncture、migraine、hemicrania等。
1.3 纳入研究的偏倚风险评价
采用复旦大学JBI循证护理合作中心翻译的中文版“JBI干预性研究证据预分级系统[14]”将纳入研究按实验性研究、类实验性研究、观察性-分析性研究、观察性-描述性研究、专家意见划分为1~5级。采用“JBI循证卫生保健中心质量评价工具”对不同类型研究进行质量评价[15-17]。其中,随机对照研究共13分,考虑到针灸操作施术者的盲法难以实施[18],因此“是否对干预者采取了盲法”条目指定为“不适用”,排除该条标准后共12分;类实验研究总分9分;病例报告总分8分。因不同研究条目总分不同,将不同研究类型得分除以总分进行标准化。
1.4 文献筛选与资料提取
由2名研究者独立筛选文献、提取资料并交叉核对。如有分歧,则通过讨论或与第三方协商解决。资料提取内容包括:作者、标题、发表年份、针刺方案、临床疗效指标等。
1.5 多指标决策计算文献综合权重[19 ]
1.5.1 构建决策矩阵
一个多指标决策问题由以下3个要素构成:n个评价指标fj(1≤j≤n)、m个决策方案Ai(1≤i≤m)、1个决策矩阵D=(xij)m×n(1≤i≤m,1≤j≤n),其中元素xij表示第i个方案,第j个指标的值。在本研究中,决策对象Ai为所有纳入数据挖掘研究的文献,决策指标包括:证据等级、文献质量、样本量、治疗前后VAS差值,据此构建决策矩阵。
1.5.2 决策指标赋值及定义
各决策指标按如下规则赋分:证据等级按1~5级分别赋为1~5分;文献质量、样本量、VAS差值为连续型资料,直接纳入后续多指标决策计算。其中“证据等级”定义为成本型指标,即分值越低(证据等级越高)对决策越有利,其余指标均为效益型指标,即分值越高对决策越有利。
1.5.3 标准化决策矩阵
采用线性比例变化法对不同量纲指标进行标准化后,得到的矩阵R=(rij)m×n。
1.5.4 指标权重计算及多指标决策
采用熵值法计算各决策指标权重。熵值法是一种客观赋权法,依据各指标值所包含的信息量的大小来确定指标权重。采用简单线性加权法进行多指标决策,该方法通过计算各评价方案的线性加权和,并以此作为各决策对象的得分依据。
1.6 加权关联规则分析
本研究采用R软件arules包计算关联规则,根据Ayse等提出的加权关联分析算法进行规则加权[6]。该算法由如几下步骤组成:① 设定初始最小支持度;② 运用Eclat算法获得关联规则;③ 计算每个项的平均权重;④ 对于每个规则,根据规则中存在的项的权重计算规则权重(公式1);⑤ 计算规则的加权支持度(weighted support,WSP)(公式2),并进行Min-Max标准化处理;⑥ 根据设定的支持度进一步筛选关联规则,采用加权关联规则算法对支持度进行加权处理。
![]() |
![]() |
其中,为一个项集(item set),
是第k个项集,
为该项集中项的个数,
为第k项关联规则。
1.7 构建加权共现矩阵
在进行复杂网络分析和聚类分析时首先需构建共现矩阵。共现矩阵是一个展现不同类别之间邻接关系的矩阵,而加权共现矩阵使其能够反映邻接类别的重要性。采用R语言for循环嵌套构建共现矩阵,在具体实现中首先对所有纳入的穴位进行去重作为矩阵的行和列,然后遍历每项研究,依次统计每对穴位共同出现在同一研究中的次数,从而构建出表示穴位共现关系的矩阵。在未加权矩阵中所有穴位权重相同,因而每对穴位共同出现1次记为1,而加权共现矩阵中,每对穴位所属处方具有不同权重得分,故每对穴位共同出现1次记为1×处方权重系数。以图1为例,在传统共现矩阵中,有两组处方中共同出现了风池和太阳,故其共现频次为2。在加权共现矩阵中,处方1的权重为0.5,处方3权重为0.7,因而其加权共现频次为1.2。

1.8 复杂网络及聚类分析
运用Gephi 0.1.0对网络进行可视化分析,计算网络的度(degree centrality,DC)、加权度(weighted degree)、接近中心性(closeness centrality,CC)、中介中心性(betweenness centrality,BC)、图密度、模块度等参数,比较加权与加未权矩阵参数区别,根据Modularity的社团划分算法进行聚类分析。根据腧穴共现频次,对高频共现穴对进行筛选,同时对高频腧穴进行层次聚类分析。
2 结果
2.1 文献筛选流程及结果
初检共获得文献4 434篇,包括:PubMed(n=307)、Web of Science(n=372)、Embase(n=243)、CNKI(n=1 082)、WanFang Data(n=746)、VIP(n=563)、CBM(n=1 121),经逐层筛选后,最终纳入117篇文献,包含151条针灸处方,腧穴总频次1 104次。
2.2 纳入研究类型及质量评价结果
纳入研究包含随机对照试验108篇、类实验研究8篇、病例报道1篇。随机对照试验质量评价平均得分8.85±1.52分;类实验研究平均得分5.00±2.20分;病例报道得分为6分。
2.3 熵权法确定各指标权重
采用熵值法确定不同决策指标的权重,按线性比例变化法对不同量纲指标进行标准化,分别计算各指标熵值、偏差度,据此计算各指标最终权重。结果显示,文献类型和文献质量在最终评价中所占权重较低,而样本量、VAS差值所占权重较高,其中又以VAS差值所占比例最高,见表1。

2.4 线性加权法进行多指标决策
根据熵权法所获得的各纳入腧穴处方的权重系数,采用线性加权法计算各纳入研究进行多指标决策,151条处方最终权重得分呈正偏态分布(Skewness=0.521,K-S P=0.029),最低得分为0.173,最高得分为0.752,平均得分为0.428±0.107,得分分布见图2。

2.5 加权频次分析
针刺治疗偏头痛的腧穴处方中,使用频次大于15次的腧穴有20个。基于频次统计和加权频次统计所筛选出的高频腧穴占比一致,累计频率均大于70%。但加权算法对腧穴频次排序产生影响,如足临泣、合谷、头维、百会、角孙、丘墟、三阴交、悬颅、足三里、丰隆、太溪、阿是穴等腧穴的频次排序和加权频次排序存在差异,见图3。

2.6 加权关联规则分析
设置Eclat算法初始支持度为0.1,共获得123条关联规则。对其进行加权、标准化处理后,设定WSP>0.25、置信度>0.8为筛选条件,加权算法共获得26项关联规则,未加权算法获得11项关联规则。在本研究中,较传统未加权算法相比,同等条件下加权算法发现更多关联规则,且不同关联规则间支持度区别更为明显,详见表2。

2.7 复杂网络特征分析
分别构建基于频次的共现矩阵和加权共现矩阵,运用Gephi软件构建复杂网络,共获得132个节点、


2.8 腧穴共现频次分析
腧穴共现频次为复杂网络分析的边权重。选取腧穴共现频次大于30的组合进行对比展示,共筛选出16条穴对组合,加权算法对腧穴共现频次排序存在影响,高频腧穴组合受权重影响较小,而对部分腧穴有较大影响,如太冲-外关组合,见表4。进一步分析结果显示,加权算法对腧穴共现频次影响与腧穴频次呈负相关(Spearman r=−0.961,P<0.001),见图5。


2.9 高频腧穴层次聚类分析
对高频腧穴(频次大于15)进行层次聚类分析,使用欧氏距离计算数据点之间的距离,使用Ward’s方法将数据点分组成簇,进而形成层次结构。结果显示,未加权矩阵与加权矩阵聚类大类基本一致。但未加权聚类的树状图总体高度更高,同时倾向于形成较大的簇,见图6。

3 讨论
针灸数据挖掘原始文献内部特征评价一直是困扰临床针灸数据挖掘类研究的问题,也是该类研究纳入循证针灸学体系的阻碍之一。本研究在国内外数据科学领域相关加权数据挖掘算法的基础上,提出“基于循证体系的针灸学数据挖掘算法”。该算法强调综合考虑原始文献的各种内部特征,采用熵权法对其各决策指标加权最终得到文献的总权重后再行各种数据挖掘分析。本研究以偏头痛为例应用该算法,并将其结果与经典数据挖掘算法进行比较,通过两者结果差异探讨经典算法与加权算法的临床适用性,从而审视既往基于经典数据挖掘算法结论的临床意义。
3.1 多指标决策和熵权法
恰当的决策指标选择是发挥多指标决策优势、进行合理决策的前提。本研究基于目前针灸腧穴挖掘所面临的两大难题—证据质量的模糊性与疗效评价的不确定性出发,参考循证指南构建、系统评价等规范所体现出的证据评估要点,从证据等级、文献质量、样本量、临床疗效4个维度构建综合决策指标。
首先,数据挖掘最终目的是探索出特定疾病潜在组方、组穴思路,而证据质量是给出推荐意见的重要考量因素[20],对证据质量进行分级,并在此基础上结合患者价值观和意愿作出推荐是循证医学最显著的特点[21]。在既往的数据挖掘过程中,文献质量评价通常作为纳入标准出现在研究中,但很少有研究者报告文献质量评价的具体方法和结果。也有研究者在进行数据挖掘分析前构建“证据图”,体现了原始证据质量的重视,但在实际操作中,证据评价和数据挖掘仍是两个独立的部分[4]。数据挖掘工作的特点在于对文献数据的广泛挖掘,过于限制证据质量则会影响文献纳入范围,而纳入研究证据质量过低则会降低数据挖掘的可信度。因此,将证据等级质量纳入多指标决策成为一种可能的解决方案。JBI基于多元主义的哲学观,提出多元化证据体系的来源适用于针灸学科数据挖掘工作的实际需要[14]。因此,本研究选用JBI提出的5级有效性研究证据预分类方案,并采用JBI提供的文献质量评价工具对原始证据质量进行评价。
此外,样本量大小是临床研究设计的重要环节,直接关系到研究结论的可靠性、可重复性,以及研究效率的高低[22]。在一些指南中,样本量作为证据分级或推荐等级的参考指标[23,24]。在针灸学领域,任玉兰等提出的 “针灸临床研究证据评价体系”也将样本量作为研究质量评价的参数[25]。近年来,基于大数据的真实世界研究中医药领域应用场景日益广泛[26],由此带来不同研究间样本量的差异逐渐增大。因而,在针灸学数据挖掘研究质量综合评价过程中,样本量应予以足够的重视。
最后,转化医学的最终目标是提升疗效而使患者获益[27],选择合适的、具有代表性的临床疗效评价指标是把握证据价值的关键。目前,疗效指标作为权重指标在中药处方挖掘中进行了探索性应用,如丁弋美等运用加权关联规则分析对干燥综合征的处方进行挖掘[13]、朱小林运用类似的思路分析了慢性肾脏病的中药配伍[12]。在偏头痛研究中,VAS评分、头痛发作频率、头痛相关生活质量等指标是目前偏头痛临床试验中常选用的指标,其中VAS对针刺的近期疗效反应最为直接,同时可以体现针刺的长期疗效[28]。考虑到多指标存在共线性关系、多指标带来缺失值的增多,本研究最终选用VAS评分作为代表性指标。需要明确的是,辨证论治是中医学科的鲜明特点,不同疾病在不同阶段有着不同的特征及证候规律,分证、分期选择合适的评价指标,并以此为亚组进行高质量的数据挖掘仍是今后数据挖掘工作的方向[29]。
确定测评指标体系的权重是系统测评的基础[30]。指标体系权重的方法一般可分为主观赋值法和客观赋值法两大类,熵值法是客观赋权法的代表,其本质是根据指标所包含的信息量来决定其重要性。熵值法的应用既可最大限度利用数据的特征,与各种主观赋权模型相比,熵值法能够有效避免人为因素对指标权重的干扰,从而增强综合评价结果的客观性[19]。熵权法最终计算结果显示样本量、VAS评分差值是影响指标权重的主要因素,而文献类型、文献质量仅占较小的权重。究其原因,主要是纳入的针刺干预偏头痛临床研究中92.3%为随机对照研究,证据等级为1级,文献质量评价在6~11分之间,证据等级与文献质量在结果呈现上仍为等级资料,导致这两项数据离散性较小,进而所占最终决策权重偏低。我们建议在后续研究中充分考虑文献质量评价的实际情况,若该研究领域文献质量整体较好可选用熵值法进行多指标决策,如文献研究质量差异较大,可通过专家咨询的方式以层次分析等方法确定指标权重。
3.2 加权数据挖掘算法与经典算法结果比较分析
以本研究为例,频次统计和加权频次统计结果对腧穴排序存在影响,但高频腧穴如风池、率谷、太阳、太冲、外关受其影响较小,而中、低频次腧穴则可因加权算法改变其原始顺序。同样的情况也出现在高频腧穴组合的频次差异上,据图3所示,随着腧穴频次逐渐降低,加权与未加权算法对穴对共现频次排序差异度的影响逐渐增大,一方面原因是加权算法对腧穴排序更加精确,减少了同一穴对共现频次相同的情况,而另一方面则由于加权频次是频次和权重二者综合影响的结果,高频穴对排序时频次占绝对优势,而随着频次的降低权重因素的影响逐渐凸显。偏头痛文献选穴较为集中,因而加权和未加权算法对高频数据挖掘结果影响较小,若有研究选穴较为分散,则可能影响基于选穴频次而采取的临床决策。值得注意的是,选穴分散的研究往往更能体现腧穴数据挖掘研究方法的优势和必要性。在关联规则分析中,基于加权关联规则分析算法的结果更能体现腧穴之间关联程度的差异,使得不同穴位关联规则支持度更为显著。
从共现矩阵的网络指标来看,加权共现矩阵具有更低的加权度。度就是一个节点连接边的数量,加权度是考虑边的权重后的总和。加权操作不会影响矩阵节点的共现关系,因此基于节点的指标在两种算法间无明显差异。但是,加权操作影响了边的权重,在原始矩阵中所有边的权重都为1,加权后的矩阵边权重介于0~1之间,具有较低的整体加权度。这表明,在加权矩阵中,信息更加密集,更易突出高质量或疗效较好的穴位。同样,层次聚类分析结果也显示加权矩阵和未加权矩阵聚类结构存在一定差异,加权处理影响了穴位共现矩阵的聚类结构。聚类的“高度”通常与簇内成员之间距离成正比[31]。未加权矩阵的树状图总体上更高,表明形成簇的“距离”更大。因此,未加权的方法倾向于形成更大的簇,而这些簇中包含的成员数目相对较多。加权矩阵产生簇的高度较低,更倾向于形成小簇,其内的成员之间的相似度更高。具体在腧穴处方挖掘中,加权层次聚类分析可能更易发现潜在穴位配伍规律。从聚类结果看,基于复杂网络社团聚类算法的核心处方聚类结果更能体现针灸学选学特点,如:太冲、合谷为四关穴,风池、率谷是胆经头部要穴,外关、丘墟则体现出上下取穴的配伍原则。
综上,在基于频次和关联规则的分析中,加权算法对高频腧穴和关联规则影响较小。数据挖掘的目的在于发现高频条目,因而以往腧穴频次集中研究中经典算法的结论仍然有效,而在选穴较为分散的研究中则更能体现出加权算法基于循证综合评价后的优势。在基于共现矩阵的网络分析、社团聚类分析、层次聚类分析中,两种算法的差异较大,加权后的矩阵信息更加集中,穴位间相似度增加,更有利于发现潜在的腧穴配伍规律。
3.3 加权数据挖掘算法拓展应用
本研究的应用对象为现代临床针灸数据挖掘研究,针灸学数据挖掘技术在古籍挖掘中同样具有广泛应用。目前已有学者针对中医古籍、针灸古籍进行了质量评级工作,可据此作为权重在古籍数据挖掘过程中进行赋权,进而开展基于中医循证体系的古籍数据挖掘工作[32,33]。此外,《中共中央国务院关于促进中医药传承创新发展的意见》指出,“加快构建中医药理论、人用经验和临床试验相结合的中药注册审评证据体系”[34],人用经验目前可作为支持中药注册审评证据体系的关键组成部分[35],目前已有学者提出中医医案临床证据应用与疗效评价体系[36],本研究提出的基于循证体系的加权数据挖掘算法可与名老中医经验挖掘进一步结合应用,以更好促进“人用经验”向“循证证据”转化。
3.4 结语
本研究从循证医学角度出发对传统数据挖掘算法进行了创新,提出了加权数据挖掘算法体系,使得数据挖掘结果综合考虑了原始研究的证据质量与疗效特征,整合了循证针灸学体系和数据挖掘工作流程,提升了数据挖掘结论的质量,增加了数据挖掘所得出的结论的合理性。相较于经典算法,本研究所提出的算法对发现潜在的优势腧穴、探寻腧穴间隐含的配伍关系具有优势。
需要注意的是,不同研究间临床疗效的差异不仅仅是由选穴差异所致,不同研究的针刺方法、电针应用等交互效应对患者的共同影响难以避免。本研究为探索性研究,诸类细节仍需后续多指标决策赋权时进一步优化考虑,如应进一步明确电针的使用、针刺的剂量-反应关系等因素对针刺疗效的影响,考虑就不同疾病分期、证候分型特征等进行更为详细的数据挖掘。在循证医学的背景下,进行针灸学文献研究的过程中原始研究的证据质量评价是所有研究者需谨慎对待的问题,如此才能推进适合针灸学科特色的循证医学体系的进一步完善发展。