当前位置:首页 > 作文大全 >

系统评价:证据为本社会工作的方法基础

发布时间: 2022-03-12 08:53:37 浏览:

[摘要]随着政府购买服务决策的科学化,越来越多的决策需要基于证据,然而当前从业人员并不经常使用最佳依据指导决策和实践,这种情况也越来越受到重视,迫切需要加强证据为本的社会工作理念。社会工作教育者和研究者需要掌握更加专业的证据生产方法——系统评价,从而为证据为本的社会工作提供当前最佳的决策证据。本文将从问题的提出、检索和筛选文献、质量评价、数据分析合成、研究结果讨论等部分介绍系统评价的撰写方法,期待被国内更多的社会工作研究者和教育者应用。

[关 键 词]证据为本 系统评价 社会工作

[基金项目]本文为兰州大学“中央高校基本科研业务费专项基金”面上项目(编号:LZUJBKY-2016-69)、兰州大学“中央高校基本科研业务费”项目(编号:16LZUJBWTD013)的阶段性成果。

[作者简介]拜争刚,男,南京理工大学公共事务学院教授,研究方向:循证社会科学;吴淑婷,女,兰州大学循证医学中心,研究方向:临床医学;齐铱,女,美国南加州大学教授、博士生导师,研究方向:老年健康;何雪松,男,华东理工大学社会与公共管理学院教授、博士生导师,研究方向:精神健康、社会理论;隋玉杰,女,中国人民大学社会与人口学院社会工作系副教授、硕士生导师,研究方向:老年心理健康;沈晖,女,南京大学社会学院社会工作与社会政策系副教授,研究方向:精神与行为健康、医务社会工作;冉茂盛,男,香港大学社会工作及社会行政学系副教授,研究方向:社区精神卫生;Haluk Soydan,男,美国南加州大学社会工作学院教授,研究方向:循证社会工作;沈瓊桃,女,台湾大学社会工作学院教授、博士生导师,研究方向:儿童福利;高翔,女,北京大学社会学院副教授,研究方向:儿童福利。

[中图分类号]C916 [文献标识码]A [文章编号]1008-7672(2017)04-0072-08

循证实践(Evidence-Based Practice),即循证学。其理念始于20世纪末发展起来的循证医学。最初意指医生“将当前所能获得的最佳研究证据与自身的专业技能及患者的價值观整合起来实施治疗” 。此后,它便以迅雷不及掩耳之势席卷了整个医疗卫生领域,并不断向邻近学科渗透,形成了循证心理治疗、循证教育学、循证社会学等数十个新的学科领域。循证社会工作即循证实践的理念和方法在社会工作中的应用。在2008年出版的《社会工作百科全书》第20版中,正式收录了“循证实践”词条。认为“循证实践是一种教育与实践范式,包括一系列旨在帮助实践者与管理人员识别、选择与执行对案主进行有效干预的预定步骤”。①

循证是社会工作迈向科学化的重要组成部分。1999年Eileen Gambrill最早提出了要在社会工作中引入循证的概念;2003年Leonard Gibb出版了第一本社会工作手册;同年Aaron Rosen 和 Enola Proctor制定了循证社会工作指引。②应循证医学在社会科学领域发展的要求,2000年2月,Cochrane协作网的姊妹组织Campbell协作网在美国宾西法尼亚大学宣告正式成立。Campbell协作网主要任务是与Cochrane协作网合作,为社会福利、心理、教育、司法犯罪学及国际发展政策等非医学领域提供科学严谨的系统评价决策依据。③④ 其中关于社会福利方面共收录了97篇相关文献:注册题目(Registration title)28篇,研究计划(Protocol)27篇,系统评价全文(Full review)42篇,主要对经济危机时工人的就业与培训、禁止虐待儿童和民族歧视等干预措施的效果进行评价。⑤

国内的学者中,华东理工大学的何雪松最早于2004年提出循证实践“是推动社会工作在中国发展并获得社会认同的一个可能策略”,?譾?訛 即应将循证实践的理念和模式引入中国的社会工作实践。在社会工作中引入循证的概念和方法,意义在于:(1)提高决策的质量;(2)让服务对象参与设计相关政策的制定;(3)充分包含客户的价值观和期望;(4)使现有最佳证据能被最好地利用于社会工作实践,避开了主观独裁的做法;(5)保证了社会工作的透明度和诚实性,最大限度地填补了研究和实践之间的差距。

如今社会工作面临的问题越来越复杂,从业人员并不经常使用最佳依据指导决策和实践,这种情况也越来越受到重视,迫切需要加强社会工作中循证的概念。⑦ 循证实践理念的核心在于证据等级,等级越高证据越强。系统评价(systematic review)作为最高证据等级,是一种将文献资料综合评价的方式,研究者根据某一具体研究问题,系统透明地收集世界范围内已发表或未发表的相关原始研究,用统一的科学评价方式筛选出符合标准的文献,并用质性或定量的分析方法得出结论,从而为实践提供最佳科学依据。Campbell系统评价按照结构化的准则和标准来总结国际干预性研究在司法犯罪、教育、国际发展和社会福利方面产生效果的证据。本文将系统介绍循证社会工作的系统评价撰写方法。

一、 系统评价的方法与步骤

系统评价是一种二次研究方法,主要由以下部分构成:提出问题,检索和筛选文献,质量评价,数据分析合成,研究结果讨论。

1. 提出问题

社会工作是社会建设的重要组成部分,它是一种体现社会主义核心价值理念,遵循专业伦理规范,坚持“助人自助”宗旨,在社会服务、社会管理领域,综合运用专业知识、技能和方法,帮助有需要的个人、家庭、群体、组织和社区,整合社会资源,协调社会关系,预防和解决社会问题,恢复和发展社会功能,促进社会和谐的职业活动。任何一种社会活动都需要运用多种方法,多视角地去观察研究,质性研究和定量研究基于不同的理论基础,它们之间虽有差异却并不排斥和矛盾,定量研究侧重于对某干预措施的效果进行评价,注重诊断方法的准确性,质性研究指通过观察法、个人访谈、焦点小组讨论以及参与性研究等方法, 或是分析文字或影音记录资料等方法获取资料,目的是从研究对象的角度去了解、解释行为、观点、态度和经验等现象,定量研究与质性研究具有不同的贡献。?譹?訛 根据社会工作的服务性、稳定性、发展性、调节性等特点,循证社会工作不仅需要来自定量研究的证据,更需要通过现场观察、体验或访谈来收集资料的质性研究来扩充。这两种研究方法都是社会科学研究中的常用方法,两者并不存在孰重孰轻的问题,应当基于研究对象,针对需要解决的问题适当地将这两种方法结合起来使用,以使研究结构能够更加科学客观。这才是科学的研究态度。?譺?訛

构建应用定量研究回答的问题时可采用国际上通用的PICO模型:P(Population/Problem)指特定的人群/问题,I(Intervention/Exposure)指干预措施或者是暴露的危险因素,C(Comparison/Control)指对照组或是另一种可用于比较的干预措施,O(Outcome)为结果。如在董洁《基于循证心理实践的高校新生适应障碍筛查和干预研究》(以下简称《研究》)一文中,研究对象为高校新生,心理干预策略为实验组采取认知行为疗法和动力分析疗法,研究设计为随机对照实验,评价指标为适应障碍情况。?譻?訛 如今随着医学领域所研究问题的飞速发展,单纯使用PICO模型来构建问题远远不够。因此,越来越多的研究者在PICO模型的基础上针对临床中所遇到的问题提出了新的构建模型,如PICOS(S指Study Design)、PICOT(T指Time)等。由于篇幅有限,在此不做详细介绍。

PICO模型不适用于通过现场观察、体验或访谈来收集资料的质性研究。国外研究者提出了一个更适用于质性研究问題构建的SPIDER模型:S(Sample)指研究对象、PI(Phenomenon of interest)指具备的特征、D(Design)指具体研究设计、E(Evaluation)指评价、R(Research type)指纳入的研究类型。?譼?訛?譽?訛?譾?訛 如在上文提到董洁的《研究》中,S指高校新生,PI指刚刚步入大学、对自身需求不明确的新生,D指焦点群体访谈法,E指大一新生的适应概念体系中的内容要素、新生对现状满意程度、受访者心理健康及是否存在适应障碍,R指质性研究。明确选题要素对随后检索文献十分关键。质性系统评价能够从不同角度观察、分析问题,例如能够从定性角度探究某种干预措施的执行与持久程度的影响因素等问题,为决策者基于实际情况决策提供可靠依据。同样,针对某种干预措施,质性系统评价也能够提供参与者对其接受程度和依从性证据,为定量研究提供前期理论基础,弥补单纯定量研究的不足。

2. 检索和筛选文献

检索是整个系统评价过程中重要的一步,而关键词的确定和数据库的选择又是检索的两大决定性要素。检索词的提取是否正确、数据库的选择是否合理全面,会影响检索的结果甚至论文的发表。因此首先要对研究课题有深刻理解并进行剖析,查找主题词的同义词和近义词,明确检索目的、要求、内容,再确定其他检索要素如学科范围、文献类型、回溯年限等。如在董洁的《研究》中,根据SPIDER原则,可初步分解出S:高校新生;PI:刚刚步入大学、对自身需求不明确的新生;D:焦点群体访谈法;E:大一新生的适应概念体系中的内容要素、新生对现状满意程度、受访者心理健康及是否存在适应障碍;R:质性研究。确定这些以后,即可制定检索式实施检索。如这里提到的例子,检索式简单归纳为:((适应不良[关键词])OR(适应障碍[题目]))AND((大一[题目])OR(新生[题目]))NOT((小学[题目])OR(中学[题目])OR(高职[题目])OR(大专[题目]))以及(adjustment disorder[Title])AND ((intervention[Title]) OR (therapy[Title])) NOT ((medicine[Title]) OR (medical[Title]))。

目前网上电子数据库种类繁多,在充分考虑研究问题设计的领域后全面查找,最好不要限制语种和时间。一般常规数据库有ProQuest(学位论文全文数据库)、Google Scholar(谷歌学术)、CNKI(中国学术期刊)、ISI Proceedings(科技会议录索引网络数据库)、EBSCO(检索平台)等,在有明显针对性的数据库中,Sociological Abstracts(社会学文摘数据库)和IBSS(国际社会科学参考书目数据库)等,这些对循证社会工作领域的文献检索有较大帮助。另外可进行补充说明的数据库有如ASSIA等。

系统评价检索信息源主要包括:综合性文献数据库资源,专题数据库,其它文献(会议论文、学位论文)、手工检索相关杂志、已发表研究参考文献和与研究通讯联系作者。完成检索后,应由至少2名以上研究人员独立进行文献筛选,根据研究课题和检索目的精确提取符合纳入标准的文献,并避免误将本该纳入的单个研究剔除。完成文献的检索和筛选后,方可进行质量评价步骤。

3. 质量评价

文献的质量评价指研究结果接近真值的程度,即受各种偏倚因素如选择偏倚、实施偏倚、失访偏倚和测量偏倚的影响情况。?譺?訛质量评价的结果主要作用:(1)在解释研究结果时,根据研究质量的高低,给予相应的权重,即质量高的权重大,因其可信度高;(2)应用于敏感性分析(sensitivity analysis),即将质量高的和质量低的文献分开进行分析,比较分析结果是否存在差异;(3)删除纳入的低质量研究,但这种做法并不普遍。?譻?訛

目前许多工具可用于质量评价,如Jadad量表和PEDro量表等已被广泛应用于评价随机对照实验研究的质量高低。但针对循证社会工作中的不同研究类型,质量评价的方法也不同。此处简单介绍:非随机干预性研究偏倚风险评估工具(the ROBINS-I Tool)。它是由Cochrane偏倚方法学小组和Cochrane非随机研究方法学小组在2014年制定的适用于队列研究、病例对照研究、自身前后对照研究、中断时间序列研究和半随机研究风险评估的工具。评价工具由7大方面构成:混淆偏倚、研究参与者选择偏倚、干预类型分类偏倚、偏离预期干预措施引起的偏倚、失访偏倚(数据缺失偏倚)、结局指标测量偏倚、选择性报告结果的偏倚。这七个方面共计34个问题,每个问题的评价等级划分为:低偏倚风险(low risk of bias)、中偏倚风险(moderate risk of bias)、高偏倚风险(serious risk of bias)、极高偏倚风险(critical risk of bias)、无法判断(no information on which to base a judgment)五个级别。The ROBINS-I Tool评价工具为所有类型的非随机干预性研究提供了一个框架,它重在关注内部稳定性,涵盖了所有可能使结果发生改变的偏倚项目。?譼?訛 “CONSORT声明”是试验报告的统一标准声明,为报告各种随机对照临床试验提供指导,主要针对最常用的设计类型,即两组平行随机对照试验。对于非药物治疗类临床试验报告,应用CONSORT声明进行规范与指导时,CONSORT声明的项目需进行相应的扩展与调整。经专家们一致讨论修改后的CONSORT扩展版将有利于提升非药物治疗类RCT报告的报告质量。

4. 数据分析合成

针对定量研究,研究者进行数据分析时通过以下几个步骤:第一,选择合适的分析软件,多用SPSS、STATA、Revman等软件,具体的处理方法有描述性分析、独立样本T检验、单因素方差分析、LSD检验、相关分析、回归分析等,研究者要清楚这个选择可能会影响研究结果的可靠性;第二,选择统计指标模型;第三,决定是否需要校正的结果以消除偏倚;第四,解决数据缺省的问题;第五,合并多个实验效应;第六,如果不能定量合并,选择合适的预备方案;第七,评价、分析结果;第八,进行敏感性分析。

针对质性研究,在对信息进行提取整合时,有以下基本步骤:首先,文献的纳入排除及标准;其次,原始研究的方法学;再次,单个研究的确定标准;最后,质性研究中纳入文献的标准。质性研究的证据多是用文字描述个人的行为或者经验,提取质性资料有不同方式,可以提取符合纳入标准的数据以避免忽略原始研究中的发现,也可有针对性地提取特殊形式的证据,例如直接通过访谈或观察所得的证据;可以只提取质性研究的核心设定,例如研究问题、研究设计等,也可收集该研究中提供的所有信息,包括该研究收集与分析数据的方法,作者对其数据的解释等;还可以选择使用一个理论框架以指导数据提取,将不同研究的结果转化以便于证据分析。?譹?訛但是此方法对选择的理论框架要求较高,如果该框架并不适用于某些证据的提取,则需要对该框架进行改良。具体质性证据提取方法的选择需要针对该研究的具体情况以及系统评价的需求自行设计。

质性系统评价所研究的问题具有多样性,其纳入的研究设计类型也具有多样性,因此质性系统评价有其特有的资料综合方法。例如Meta-人种志(Meta-ethnography)致力于确定各质性研究之间的关系,针对结果相互支持的研究、相互对立的研究,也可以通过列举两个相关研究的论据以进行对比。CIS (Critical Interpretive Synthesis)改编自Meta-人种志,适用于提取广泛的研究对象的质性研究,如对弱势群体的医疗保健的可行性研究 ,其最终的目的是综合研究中的论点以提出新的学说或者概念。?譺?訛主题综合(Thematic Synthesis)是通过主题分析的方式,首先对纳入的研究进行信息提取,接着发展描述性或者分析性的观点,然后通过综合各研究之间的观点,提出描述性或者分析性的主题。无论是质性或定量研究,均通过以下方式更好地分析结果:用表格形式展示文献检索流程,检测已制作好的图表,分析研究文献来源的异质性,考虑所有试验或亚组试验的Meta分析,进行灵敏度分析,列出被排除的研究文献,分析研究过程中某些步骤出现的问题和原因。

5. 研究结果讨论

(1) 研究文献的发表偏倚:由于系统评价是对文献的二次研究,所以发表性偏倚是重要而又难以避免的,需要在结果中讨论其对结果的影响。检验研究系统评价是否受到发表性偏倚影响的一种办法就是通过制作漏斗图检查。然而,如果漏斗图不对称,除了发表性偏倚以外,还得考虑其它原因。

(2) 证据的强度:讨论部分最好首先说明纳入研究和评价方法上的局限性,这可能会影响决策制定及将来的进一步研究。应统一讨论纳入的研究与其它证据强度。例如,在论述不同土地产权制度对发展中国家的农业投资生产率的影响时,可能会纳入发达国家的研究,则在结果中必须明确指出所参考的其它证据是否经过了系统的评价

(3) 间接证据:间接证据有助于对某一干预措施和主要结局指标之間可能的因果关系进行讨论,包括有关中间结果的证据,不同人群的研究证据,以及相似证据(如类似干预)。由于对干预效果强度的结论本质上是因果推论,因此研究者应了解评估因果推论强度的标准,需要考虑以下几点:纳入研究的质量如何,观察到的效果及意义,不同研究之间的一致性,是否有明确的量效关系,是否有间接证据支持,是否有排除了其它可能的解释。

(4) 结果的适用性:Campbell系统评论的使用者必须判断证据的适用性。为此,首先要确定评价中潜在利弊信息是否准确,还需判断纳入研究的受试者与环境和自身情况是否类似。此外,必须考虑纳入研究中的干预特征,对证据的适用性做出判断。适用性的判断取决于对特定情况的了解。在阐述系统评价结果的适用性时,研究者应注意不要假定他们的自身情况与纳入研究所反应的情况相似,但研究者对可能的适用范围的关注以及不同情况所出现的结果的预测有助于决策的制定。通常并不是简单地规定某一证据的适用范围,而是要研究这一证据为什么不适用于某些特定情况。有时研究者通过某些重要特异性对证据适用性的限制来帮助制定具体决策,这些特异性包括:

a. 生物特异性和文化特异性:对于卫生保健方面的问题,如精神问题,文化差异有时可能是影响结果适用性的因素之一。

b. 依从特异性:服务提供者和接受者的依从特异性也会影响结果的适用性。依从特异性取决于经济条件或观念的差异,这可能会使一些医疗服务在某些环境下(如发展中国家)无法开展。

c. 基线特异性:干预的净效益由无干预情况下负干预结果的风险和干预的效果共同决定。首先要确定措施的利弊和适用性,其次需考虑干预措施效果差异的限度。研究者不可能对全球范围内的特异性逐一论述,但可以对所研究的人群已知的特异性加以说明。

(5) 其它与决策相关的信息:例如费用﹑当前的实际情况、统计效能(一个试验的统计效能同时取决于该试验的样本量和患者的价值及意愿)以及说明对未来研究的意义。

二、 应用系统综述举例:老年听力障碍患者的沟通强化疗法研究

1. 构建问题

WHO (2000)报告显示全球有2.5亿听力障碍人群,占全球总人口的4.2%,其中2/3来自发展中国家,如菲律宾和泰国等。2006年WHO在中国江苏省进行大型流行病学调查,结果提示60.9%的60岁以上老人患不同程度的听力障碍:33.1%有轻度听力障碍,17.8%中度听力障碍,5.9%重度听力障碍,1.3%极重度听力障碍。WHO (2006)估计中国人群听力障碍发病率为59.9%,其它发展中国家人群的听力障碍发病率约50%-60%。?譺?訛 WHO (2007)报告示全球有2.78亿人患轻度、重度双耳听力损伤。听力障碍不是单一、孤立的疾病,而与周围环境密切相关并相互影响。由于不能独立生活、逐渐与社会隔离、抑郁、危险因素增加、生活质量严重下降等原因,老年听力障碍患者可诱发其它大量消耗医疗资源、社会资源的疾病。?譻?訛 鉴于听力障碍的疾病负担如此严重,急需有效、易推广、患者易接受,并根本上改善听力障碍患者生活质量的干预措施,不能单纯依靠临床医学解决老年听力障碍问题,需要社会医学的关注、介入。

小组交流训练是一种更容易接受、更自然改善老年听力障碍方法。其主要通过训练听力障碍者解决日常生活中存在的问题达到改善老人听力障碍目的。有研究显示:老年听力障碍患者可通过个人或小组交流训练改善听力障碍。?譼?訛?譽?訛?譾?訛 小组交流训练在改善老年听力障碍方面可能比个人交流训练效果好,容易为老年人接受。

2. 检索证据

在MEDLINE (PUBMED)、EMBASE、ProQuest、 CNKI等电子数据库中的检索词包含以下三部分:老人或老年或听力障碍或听力减退(Aged OR Aging OR Senior )AND (Hearing disorders OR Hearing impairment OR Deafness OR Hearing loss OR Dysacusis OR Parecusis);交流训练或小组训练或视觉训练或听觉训练(Communication OR Group therapy OR Psychotherapy OR Auditory rehabilitation OR Group aural rehabilitation) And (Hearing aids OR Audiologic rehabilitation OR Auditory training);测量指标:生活质量或交流障碍或听力策略(Quality of life OR Communication limitation OR Hearing strategy)。联系纳入研究的作者和相关专家获得其他相关发表/未发表的研究,系统跟踪和追溯纳入研究的参考文献。手工检索Journal of the American Academy of Audiology, Ear & Hearing, British Journal of Audiology等,并检索相关政府网站、用户者网站、学术网站、会议网站。

3. 評价证据

由两名评价者独立阅读检索到文献的题目和摘要,以确定研究是否符合纳入排除标准。对不能确定是否被纳入的研究,研究者将调取和阅读文献原文,最终确定研究是否符合纳入标准。若两名评价者对是否纳入某篇研究存在争议,首先通过相互讨论达成一致意见。如果未达成一致意见,由第三方决定最终是否纳入。对于通过阅读摘要和题目被确定纳入的研究,两名评价者将调取全文并独立阅读全文提取重要信息,包括研究设计、干预措施、结果、研究评价、测量结果。如两位研究者纳入研究信息提取不一致,将由协商或经第三方决定。

4. 合成证据

本研究未找到充分的证据支持小组交流训练是比其他康复措施更有效改善老年听力障碍的措施。基于目前纳入的研究,本系统评价认为小组交流训练改善听力障碍的短期效果非常明显:增加了患者对听力障碍的进一步认识,提高了生活质量,更好掌握使用助听器的方法,很好地掌握了交流策略和提高了个人调解能力。但其长期效果需要新的研究进一步验证。?譹?訛

三、 结语

系统评价作为循证实践理念的核心和最佳证据来源,虽已在国际上流行起来,但在我国社会工作领域的应用力度仍不大。健康领域大量基于定量研究的系统评价已得到广泛应用,但质性研究的系统评价仍需不断完善和发展。通过上文阐述的提出问题、检索证据、评价证据、综合证据得出结论等方面完成一篇质性研究系统评价的撰写,其证据的特殊性可很好弥补定量研究的不足,为社会工作者的决策提供更好的指导。随着政府购买服务决策的科学化,越来越多的决策需要基于证据,因此社会工作教育者和研究者需要提供更加专业的研究方法培训。如社会工作教育者和研究生需要接受国际规范的Campbell系统评价撰写方法培训,社会工作博士研究生应该改变传统的社会学博士论文撰写方法,只有这样才能为我国的社会工作实践和决策提供可靠的研究证据。笔者联合在循证社会工作做得非常好的美国南加州大学社会工作学院以及国内其他相关高校,创建了中国首个循证社会工作研究机构——中国儿童及老年证据转化平台,同时与国际Campbell协作网建立了长期的合作关系,为开展高质量的循证实践理念和系统评价撰写方法培训奠定了良好基础。

(责任编辑:亚立)

相关热词搜索: 社会工作 为本 证据 评价 基础

版权所有:无忧范文网 2010-2024 未经授权禁止复制或建立镜像[无忧范文网]所有资源完全免费共享

Powered by 无忧范文网 © All Rights Reserved.。冀ICP备19022856号