为促进肿瘤学真实世界证据研究的质量和透明度,欧洲肿瘤内科学会(European Society for Medical Oncology,ESMO)开发了首个针对肿瘤学真实世界证据研究的具体报告规范:the ESMO guidance for reporting oncology real-world evidence(ESMO-GROW)。为方便读者更好的对报告规范的理解与应用,本文对ESMO-GROW清单的制订过程和主要内容进行介绍和解读。
真实世界数据(real-world data,RWD)是指从电子健康记录(electronic health records,EHRs)、医疗索赔记录、患者登记信息、健康调查以及来自移动健康应用程序和可穿戴设备等非临床试验环境中获得的研究数据,这些数据反映了患者的治疗过程、治疗反应以及疾病的自然进展的医疗保健的真实情况[1]。由RWD提取的真实世界证据(real-world evidence,RWE)反映了医疗干预措施在现实世界中的效果和影响,为医学研究领域提供了有意义的见解和结论[2]。近年来,RWE在医学研究,尤其在肿瘤学研究中的应用重要性日益凸显,这一趋势不仅体现在相关学术论文的数量持续增长,也反映在RWD在医药监管领域中日益频繁的应用上[3-5]。尽管目前已经制订了多项与RWE研究报告相关的指南,但肿瘤学研究领域的独特性质,如特定变量、生物标志物的使用、治疗方法及其结果的多样性,以及人工智能(artificial intelligence,AI)、机器学习(machine learning,ML)和深度学习(deep learning,DL)等现代技术在RWE数据分析各阶段的应用,带来了新的挑战[6],这些挑战尚未在现有指南中得到充分解决。鉴于此,2023年11月欧洲肿瘤内科学会(European Society for Medical Oncology,ESMO)在Ann Oncol发表了首部肿瘤学RWE报告规范(ESMO guidance for reporting oncology real-world evidence,ESMO-GROW)[7],旨在提高肿瘤学RWE研究报告的完整性,提升基于RWD的肿瘤研究质量和透明度,并推动该领域研究的标准化。本文详细解读ESMO-GROW清单的核心条目,并结合实例进行分析,以助于国内研究者更好地理解和应用这一规范。
1 ESMO-GROW开发过程及内容
ESMO-GROW报告规范的开发是一项跨学科、多阶段的协作工作。首先,通过全面的文献回顾确认了肿瘤学领域对特定RWE报告规范的需求。4位作者基于文献检索起草了ESMO-GROW初稿。随后,通过包括来自临床肿瘤学、统计学、AI、数字健康等多领域的跨学科专家以及期刊编辑和审稿人的反馈,该手稿经过多次修订和完善。通过分组工作和定期会议,该报告规范逐步完善,并由核心团队统一整合。所有建议均通过投票确定,并在全天会议中讨论,以解决任何分歧并达成共识,如果>90%的作者同意该提案,则建议获得批准。此外,还考虑了外部利益相关者(患者权益倡导者、行业代表、欧洲药品管理局、出版商、AI、癌症数据库和健康政策方面)的个人专家的反馈。最终,通过所有作者的投票,形成了包含6个主题,35项条目组成的ESMO-GROW清单。
2 ESMO-GROW清单条目解读
ESMO-GROW清单共包含与RWE出版物各部分相关的6个主题:标题、前言、方法、结果、讨论和结论、最终考虑因素,共35条报告建议,具体内容见表1。

2.1 标题
条目1:根据研究内容,简明扼要地列出与研究类型、研究对象、研究目的、数据来源和研究结果有关的关键词。建议考虑加入“真实世界”或“观察性”等术语。
解读:在肿瘤学RWE研究的标题构建中,选取恰当的关键词至关重要。它们不仅反映研究的核心,还影响文章的可检索性。ESMO-GROW清单建议使用如“真实世界”或“观察性”等术语以明确研究类型,区分于例如随机对照试验的其他研究形式。此外,关键词还应细化至具体人群、肿瘤类型、研究环境和治疗方式等,以便快速传达研究的主要内容。同时,关键词的选择还应考虑期刊的字数限制和标题的吸引力。最后,研究设计的性质(前瞻性或回顾性)也是关键词选择的重要方面,可以为读者提供关于研究方法的线索。
2.2 前言
条目2:阐述研究问题的科学依据,并提供关于以往系统评价、Meta分析、临床试验和(或)RWE研究的核心证据的简明背景信息。
解读:前言部分的目的是提供关于研究领域已知信息的概述,并阐明激发研究设计的未满足需求和证据空缺。作者在撰写研究的前言部分时,首先应提供先前研究的证据总结,包括系统评价、Meta分析、临床试验和先前的RWE研究。这有助于构建研究的理论基础,并确保读者了解该领域的现状。其次,选择文献时应优先考虑高级别证据,确保研究基于最可靠和相关的信息。
条目3:识别证据中的差距,并解释为什么以及如何通过RWE研究来适当解决这些差距。具体说明当前研究预期产生的新证据。
解读:在确定研究的必要性时,关键在于识别和适当解决证据中的差距。具体来说有三点:首先,作者需明确研究领域中证据的不足,包括数量、质量和强度上的限制,及现有研究未解决的问题;其次,作者应阐释RWE研究可能的贡献,例如为通常被排除在临床试验之外的患者群体提供证据,或为合成对照组提供基础[8,9];最后,应讨论预期获得的新证据,包括RWE研究可能提供的证据类型以及其优缺点。
条目4:简要介绍研究目的。
解读:作者应在前言的结尾处陈述研究目的,根据研究设计的不同,可简明扼要地报告患者人群、暴露因素和结果。
2.3 方法
2.3.1 研究目的、设计、数据来源和变量
条目5:提出研究问题,包括对患者或研究对象以及目标结果的描述。
解读:研究问题的清晰陈述对于理解研究的目的和结果至关重要[10]。因此在描述研究问题时,ESMO-GROW清单建议作者考虑以下几个要点:首先,研究问题应明确且准确,以便读者能够清楚地理解研究目的和意图。如果有必要,可以提供与研究设计相关的具体信息,如人口统计学特征、肿瘤特性、研究环境等,以便提供完整的研究背景。如果研究目的是分析性的,可以采用患者或人群、暴露因素、比较组和结果(PECO)框架报告研究问题,以清晰定义研究的核心要素[11];其次,在解释性研究中,应报告感兴趣的暴露因素。在比较性研究中,应清楚说明比较组的性质;在预测性研究中,应详细阐述预测模型的开发、验证或探索预测因子的目的,还应报告所评估的预测因子;最后,作者应明确区分并详细描述主要和次要研究结果。
条目6:阐述研究目的,并考虑将研究类型归类为描述性和(或)分析性(解释性或预测性)。
解读:在肿瘤学研究中,清晰地表述研究目的以及准确分类研究类型不仅有助于研究设计的准确性,也对研究结果的解释和应用具有重要影响。研究目的通常可以分为为描述性或分析性(解释性或预测性)。描述性研究关注现象的特征或分布,如疾病流行率的评估,通常基于大量人群数据,无需对照组;分析性研究则探究变量间关系,包括因果关系(解释性)或预测未来事件(预测性)[12]。
条目7:提供相关信息,对用于解决研究问题的研究设计进行描述和分类。
解读:首先,作者需要根据研究的目的(描述性或分析性),选择适当的研究设计并进行详细描述。例如,对个体水平数据进行分析时,可能选择病例报告、横断面研究或队列研究;而对于人群水平数据分析,则可能采用生态学研究[13];若采用创新或特定研究设计,如准实验研究,需详细描述以便理解其特性和局限性;其次,应描述RWD在实验设计中的应用,如市场后监测研究、合成对照组和实用性试验和观察性研究。然后明确说明“前瞻性”和“回顾性”术语的具体应用,包括研究时间段、数据源和核心变量的时间点;最后作者可以考虑使用说明性图表来描述研究设计,帮助读者更好理解研究结构和流程。
条目8:明确界定用于选择研究对象或患者的资格标准,特别涉及与癌症相关的方面。
解读:在肿瘤学研究中,对患者或研究对象的选择标准进行清晰的定义,尤其是与肿瘤相关的方面,对于评估样本的内部和外部效度至关重要[14]。以下是对ESMO-GROW清单关于撰写资格标准的建议:第一应清晰描述包括纳入和排除标准以及时间框架的资格标准;第二对于基于个体的肿瘤学研究,应提供关于患者的人口统计学数据、肿瘤类型、组织学特征、疾病阶段、可能的生物标志物、先前治疗和共病情况等详细信息;第三如果研究对象是人群(例如,来自普通人群的共同特征个体的人群基础研究)或其他类型的数据(例如,药物警戒数据库中的事件),则应提供与该对象相关的资格标准;第四应明确规定纳入病例的时间;第五如果研究具有比较性,也应提供比较组的特征。在RWE研究中,资格标准通常比控制临床试验中的更为实用,通常允许更广泛的人群代表性(更高的外部效度)[15]。
条目9:报告所使用的RWD源的具体类型和目的,提供详细描述以解释选择该数据源以满足研究目的的原因。
解读:ESMO-GROW清单强调了对所使用RWD的类型和目的进行详细描述的必要性。首先,作者应清楚地描述数据源的主要收集目的和开始日期,尤其是那些常规收集的数据。这种描述不仅帮助读者理解数据的来源和性质,而且还揭示了数据集如何与研究目的和问题相适应;其次,作者应详细说明所选数据源是否适合解决特定的研究目的和问题;此外,作者还应详细描述所收集数据的一般类型,包括数据的完整性、数据库中患者的资格、卫生保健环境(如一级、二级或三级保健)、地理详细信息(如国家和地区),以及数据库是否覆盖所有患者或仅特定医院或患者群体。当数据是通过特定工具(如问卷)收集时,作者需要进一步说明这些工具的选择、设计和验证过程,确保数据收集方法的适用性和准确性;最后,如果数据采集方法涉及到新技术(如可穿戴设备),则应提供相同水平的详细信息。
条目10:当使用多个RWD源时,提供关于互操作性的详细信息,包括识别重复病例或从不同数据库链接数据的方法。
解读:在使用多个RWD源进行肿瘤学研究时,处理不同数据源之间的互操作性是一项关键任务。因此,在撰写文章时需要细致地处理和报告以下几个关键方面,以确保数据的准确性和研究的可靠性。第一,作者需要描述用于识别两个或多个可能包含重叠人群数据源中的潜在重复病例的方法,以及用于链接同一患者数据的技术和变量。这包括用于个体级数据的唯一标识符或用于区域级数据的匹配变量(如医院)。第二,如果不同数据源包含将被合并但编码方式不同的变量,作者应详细解释重新编码的原因和方法。第三,在处理数据集之间存在的数据差异时,应报告具体的解决方法,包括数据传输的标准和遵守可查找、可访问、互操作和可复用(findable, accessible, interoperable and reusable,FAIR)数据原则的方式;第四,如果使用通用数据模型来协调来自多个来源的数据,如观察性医疗结果合作伙伴通用数据模型,应提供相应模板或明确数据来源。
条目11:提供源数据和研究数据管理的详细信息及时间安排。考虑详细说明原始数据收集、更新、完整性、数据提取、清洗和(或)质量控制及验证的方法。
解读:确保数据准确性、完整性和研究透明度对提高结果可信度及易于验证和复制至关重要。因此,作者需要关注数据管理过程中的各个环节。首先,作者应该详细报告原始数据的收集、更新和完整性,这包括数据的来源、收集者、收集频率以及数据收集的方式(数字化或手动);其次,作者需要明确数据提取的具体日期,并采取质量控制措施,例如处理异常值和缺失值;此外,作者需要详细说明数据清洗和验证过程,以确保数据的准确性;最后,需要制订并执行保持数据最新的策略,特别是在变量更新和参考资料考虑方面,这对于理解和评估研究结果非常重要。
条目12:在正文或补充材料中提供数据库和(或)研究注册、管理、所有权、元数据和完整数据可获取性的核心细节。
解读:为了提高研究的透明度和可靠性,清单建议作者在正文或补充材料中提供关于数据库和研究注册的核心细节。首先,应提供包括识别信息(例如,研究缩写和注册识别号码)、参与的调查者和中心、完整变量信息(带注释的病例报告表)、数据匿名化程度、数据集访问政策、机构批准、伦理和数据保护批准(遵循一般数据保护条例和当地要求或其他适用数据保护法)等在内的全面信息;其次,研究方案建议列入补充资料,有助于读者更好地理解研究设计。此外,如果数据通过国际共享机制收集,或研究已在公共数据库注册,这些情况应被明确说明,并提供相关链接或识别码;最后,报告还应包括关于获取或免除知情同意的具体信息,以及如何处理各中心或国家间的差异。
条目13:确定每个核心变量的数据来源、定义,如果变量是衍生或编码的,描述衍生或编码是如何进行和验证的。
解读:ESMO-GROW清单建议作者在描述变量时考虑以下几个方面:第一,清晰地描述每个变量的定义和来源。这包括是否直接从数据源获取,还是通过某种衍生或编码过程得到。尤其对于主要变量如暴露和终点,应提供更为详尽的描述。第二,详细考虑每个变量可能受到的数据源特定偏倚。第三,如果变量是通过特定算法或过程衍生的,需详细描述其过程和验证方法。第四,在将变量进行编码(如将连续变量分为几个类别)时,应明确编码的逻辑和证据基础。此外,如果在不同的分析阶段采用了不同的编码方式,应提供明确的理由。这些详细信息都应在正文或补充材料中清楚描述。
条目14:明确核心变量与癌症病程相关的时间点。
解读:在肿瘤学RWE中,准确界定核心变量与癌症病程特定时间点的关系能够确保数据的相关性和解释性,提高研究结果的准确性和可比较性,并减少分析偏倚[16]。为此,建议作者在处理核心变量时,考虑以下几个关键方面:首先清晰描述每个核心变量与癌症病程中特定时间点的关系;其次当研究以癌症诊断或开始接受系统性抗癌治疗作为基线时间点时,应描述与诊断相关的因素和启动治疗的标准,如参与癌症筛查的情况、医疗获取途径和治疗方案等[17];然后作者应根据基线定义评估终点,报告标准和频率,并明确记录时间至事件变量的随访起止日期和终止情况;最后为了确保报告透明,详细的时间点信息应与变量列表一同报告,以便读者理解各变量与癌症病程的关系。
条目15:提供研究中包括的所有核心变量的完整列表,变量可以分为基线特征、暴露因素、结果或终点。
解读:作者在描述核心变量时需要特别注意以下几个关键方面:首先,作者应提供详尽的变量列表,这有助于读者全面理解研究设计、实施和结果;其次,需要细致描述基线样本特征,这对于评估样本是否能代表整个源群体极为重要[18];然后,还应阐明与癌症相关的变量,如原发性癌症诊断、肿瘤亚型、疾病阶段和既往治疗等,这对于调整研究设计以符合特定肿瘤学背景至关重要;此外,对于暴露变量,作者需明确识别和详细描述,以便于审查研究结论可能受到的潜在错误分类偏倚[19];最后,作者应明确界定研究的主要和次要终点,这有助于增强研究的目的明确性和分析深度。
条目16:在涉及生物标志物的研究中,需要提供关于生物标志物的描述、时间点、评估方法和分析验证的详细信息。
解读:在肿瘤学RWE研究中,生物标志物的详细描述至关重要,包括其特性、临床应用、评估方法和验证。免疫组化标记物的抗体信息、分子检测的样本类型和方法,以及影像生物标志物的类型和处理方法都需要详细说明,以增强研究的透明度和可重复性。
2.3.2 统计学分析与AI技术
条目17:概述统计分析的主要内容。
解读:在报告肿瘤学RWE研究中,对统计方法的明确描述极为重要。对于描述性研究,作者需要详细说明如何使用集中趋势和离散趋势的度量方法来总结原始数据。而在分析性研究中,则要求作者在正文中详细报告与研究问题相关的统计分析,并在补充材料中提供完整的统计分析计划(statistical analysis plan,SAP)。
条目18:提供有关研究预先计划的样本量要求和统计功效的详细信息(如适用)。
解读:根据研究目的,作者应详细报告所需样本量和估算的统计功效,包括主要终点、对照值估计、目的可检测差异、效应大小、最小功效、显著性水平以及采用的统计检验。这些信息对于理解研究的可靠性和结论的有效性至关重要。
条目19:具体说明为识别和减少主要偏倚来源而预先计划的策略。
解读:科学研究中的偏倚可能影响结果的准确性和研究的有效性。因此,为了控制研究中的偏倚,建议作者应首先描述可识别到的可能影响结果的潜在偏倚,如样本选择、数据收集或测量方法;其次,描述为减少这些偏倚所采取的措施,包括使用匹配和分层方法来平衡不同组别、统一方法和设备以减少异质性,应用多种统计方法评估干预效果,处理时间性偏倚以及恰当地处理缺失数据等。
条目20:明确区分预设分析和事后分析,尤其是在亚组分析中。
解读:建议作者优先考虑预设分析,未在最初的SAP中预先声明的事后分析应在报告时明确标记,并强调它们的探索性目的。在报告亚组分析时,作者应详细说明进行亚组分析的数量和呈现的数量,说明感兴趣的终点和用于评估干预或暴露差异的异质性的统计方法。此外,为了控制研究的总体错误率并保证结论的稳健性,对于解释性研究中的多重性问题的调整措施,作者也应给予报告。
条目21:提供关于内部和外部效度的信息,以及所有敏感性分析的相关信息。
解读:内部和外部效度以及敏感性分析的报告是确保研究质量的重要组成部分。内部效度关注研究方法的准确性和执行的质量,确保结果的可靠性;外部效度则涉及结果的普遍适用性[20]。敏感性分析用于检验结果的稳健性,有助于识别偏差和不确定性。作者应清楚地描述敏感性分析的方法和目的,透明地展示在不同假设情况下对结果的影响。
条目22:对于分析性研究,应在补充材料中提供SAP的完整版本,包括对任何修改的简要说明。
解读:SAP是研究设计的一个关键组成部分,它详细阐述了研究的统计方法和原理、目的研究人群及分析策略[21]。它为研究提供了一个明确的分析框架,确保研究的方法学严谨性。ESMO-GROW清单建议分析性研究中应在补充材料提供SAP的完整版本。如有任何修改,也应在报告中进行简要说明。
条目23:说明使用了哪种ML、DL或其他AI方法(如适用)。
解读:AI技术,尤其是ML和DL,已成为数据分析的强大工具,能够揭示传统统计方法难以捕捉的复杂模式和关联[22]。在肿瘤学研究中,这些技术尤为重要,因为它们能帮助从RWD中生成有价值的假设,并指导临床决策[23,24]。在报告这些方法的应用时,作者应详细记录AI算法的使用和任何对标准算法的修改,并建议将AI方法与传统统计方法进行比较,以展示其性能优势。
条目24:在使用AI算法(如ML和DL)报告RWD分析时,需包含关于数据预处理技术、特征工程策略和模型开发的详尽信息。
解读:ESMO-GROW清单建议作者使用AI算法之前详细记录数据预处理技术、特征工程策略和模型开发的全过程。这包括数据的收集、准备、清理、转换、探索性质量控制、标准化、插补、注释和编码标准等步骤。同时,应明确说明患者的纳入和排除标准。如果适用,在处理AI算法分析中,作者应包括对不同患者亚组的考虑,确保训练集的平衡性,特别是对于有共病或罕见肿瘤的患者。对于代表性不足的人群,可能需要生成合成数据。使用来自多个来源的数据集时,应描述数据整合的技术平台或方法。如果应用了如联邦学习等数据隐私保护框架,也应明确其部署类型;此外,作者应详细说明模型开发的每个步骤,这包括训练、验证和测试数据集的构建,以及特征选择、模型调整和正则化及防止过拟合和欠拟合的措施;最后作者应对所建立的模型进行性能评估,包括区分度和校准的评估,以及在外部数据集上的前瞻性验证。
条目25:阐述AI模型的可解释性和可解读性,介绍与临床实践相结合的计划(如适用)。
解读:医学研究中,可解释和可解读性的AI模型能够让医生和研究者理解模型是如何做出预测的,这对于建立信任和确保模型应用的适当性至关重要[25]。首先,要求作者在进行涉及AI模型的研究时,采用诸如可解释性AI技术的方法来阐释模型的工作机制;其次,作者应使用清晰的术语,以便目标受众(例如医疗专业人员)能够理解;最后,如果研究中的AI模型将被用于临床应用,作者应详细介绍模型在临床环境中的应用计划,包括其与现有医疗实践的结合方式、预计的部署时间线,以及相关的技术和安全性考虑。
条目26:简要描述研究所需的多学科团队,并解释这些需求是如何得到满足的(如适用)。
解读:对于肿瘤学RWE研究中涉及的多学科团队,作者可以在方法部分或者补充材料中简洁地报告。
2.4 结果
条目27:提供在样本选择的每个阶段被排除或未参与的病例数量及原因,以及随访过程中失访的病例数量。将被排除的病例与纳入分析的病例进行比较,并用流程图展示。
解读:在科学研究中,明确样本选择的每个阶段被排除或未参与的病例数量及原因对结果的可解释性至关重要,有助于提供对数据质量和潜在偏差的见解,以及复制工作和与其他研究的比较[26]。此外,比较被排除的病例与纳入分析的病例有助于评估选择偏倚和结果的普适性。这些信息应在流程图中展示,并在必要时提供详细比较。
条目28:详细描述纳入病例的基线特征(如临床人口学特征和肿瘤特征),应对分析中的不同组别的基线特征进行比较(如适用)。
解读:关于研究的基线特征,首先作者应通过表格形式清晰地展示这些基线数据,并根据研究设计的需要,对比不同组别(如暴露组和对照组)的特征;其次对于涉及比较性分析的研究,建议作者应详尽地报告各组间的特征对比,包括频率、比例、集中趋势和离散程度;此外考虑到缺失数据可能对分析结果产生的潜在影响[27],作者应详细说明每个相关变量及按研究组别的缺失值比例;最后在某些情况下,如使用倾向性评分,还建议作者增加额外的表格(通常作为补充资料),以展示分析前后的标准化差异。
条目29:报告研究的主要分析结果,简要描述相关的探索性分析(预先设定和(或)事后分析)的结果。提供读者获取完整结果的详细信息。
解读:报告肿瘤学研究的主要分析结果时,作者应详细描述主要结果、变量缺失数据、中位随访时间及每个分析组的事件数量和时间点。提供总结测量及置信区间,并报告单变量和多变量分析的相关数据。探索性分析结果应视为辅助内容,需要谨慎处理和解释。
2.5 讨论与结论
2.5.1 讨论
条目30:总结针对主要研究问题的核心结果,并根据有关该主题的现有最佳证据对数据进行客观讨论。避免随意选择文献来支持某个观点。
解读:在讨论肿瘤学研究结果时,作者应客观总结与研究目的相关的核心结果,并基于现有最佳证据进行讨论。还应在讨论开始时简要说明支持性文献的选择方法,以确保透明度。
条目31:讨论当前研究的优点和局限性,包括主要偏倚、应用的策略如何有助于避免或减少偏倚,以及作者估计残差偏倚可能会影响研究的核心结果(如适用)。
解读:在讨论肿瘤学研究的优点和局限性时,作者应强调研究的优势并总结可能影响结果的主要偏倚。描述用于减轻偏倚的方法,并承认观察性研究的潜在偏倚风险。
条目32:讨论研究结果的可推广性及其对临床实践、卫生政策或公共卫生的潜在影响,以及对未来研究假设的形成。
解读:在讨论肿瘤学研究结果的可推广性时,重要的是平衡地评估结果对临床实践和卫生政策的潜在影响,同时考虑其对未来研究方向的贡献。重点应放在统计显著性与实际临床意义之间的关系,以及研究结果如何促进新的临床和政策决策。
2.5.2 结论
条目33:全面总结与主要研究问题相关的核心结果,以及对临床实践、卫生政策和(或)公共卫生的主要影响。基于报告研究中尚未满足的需求和局限性,提出进一步研究的建议。
解读:结论部分是研究报告的关键,它应精确总结核心研究发现,评估其在临床和公共卫生领域的影响,并指明未来研究方向。作者应强调主要结果的临床和政策相关性,同时清晰地指出研究的局限和未来研究的潜在领域。结论应避免过度阐释,确保简洁和针对性。
2.6 最后考虑事项
条目34:注明所有相关的研究赞助以及直接和(或)间接或实物资助。
解读:作者应透明地声明所有研究赞助来源,无论是直接资金支持还是间接或实物资助。透明地揭示赞助来源对于保持研究的公正性和客观性至关重要。这包括明确指出赞助来源如何影响研究的各个阶段,从而帮助读者理解潜在的利益冲突,并评估研究结果的可信度。若无赞助或资助,亦应明确声明,以确保完整的透明度。
条目35:根据期刊规定,详细说明所有相关的致谢、作者声明、个人贡献以及其他最后考虑事项。
解读:在肿瘤学研究报告的最终阶段,作者应根据期刊的具体规定详细说明所有相关的致谢、作者声明、个人贡献以及其他重要事项。此外,如果使用了AI辅助技术进行手稿开发或修订,也应在相关部分进行说明。
3 实例解读
本文以2023年发表在WILEY Cancer Medicine上的研究“Apalutamide for prostate cancer: multicentre and multidisciplinary real-world study of 227 patients”为实例[28],对照ESMO-GROW清单条目,逐一解读其内容,评价结果见表1右半部分。总体而言,实例文章在多个方面表现良好,包括清晰地定义研究问题、目的、设计和患者纳入标准。它也详细描述了所使用的RWD源和统计分析方法。然而,实例文章可能需要进一步强化对数据源特点和数据管理细节的描述,以及提供更全面的关于数据互操作性和数据提取的信息。此外,对于涉及的生物标志物,实例文章也许可以提供更多关于评估方法和分析验证的细节。在讨论部分,这篇研究充分讨论了其研究结果的意义和潜在的局限性,但还可以进一步探讨其研究结果对临床实践和公共卫生政策的潜在影响。因此,本实例虽部分符合ESMO-GROW清单,特别是在明确表述研究问题和目的方面,但在描述数据源特性、数据管理细节以及数据互操作性等方面仍有改进空间,以提高报告的规范性和完整性。
4 小结
ESMO-GROW清单的推出是肿瘤学领域RWE研究的重要转折点。随着日常临床实践对治疗效果全面理解需求的增加,RWE的重要性愈发突出。这一规范不仅满足了对详尽肿瘤学数据报告的需求,而且代表了医学研究方法的进步。ESMO-GROW清单提供了关于特定变量、生物标志物、治疗方法和AI、ML、DL技术应用的具体指导,对肿瘤学研究的发展起到了重要推动作用。
然而,这一指南在实际应用中可能面临挑战。肿瘤学的特殊性和复杂性,以及技术的快速发展要求其具有灵活性和适应性。随着科技的进步和临床实践的变化,该指清单可能需要定期更新,以保持准确性和相关性。建议将ESMO-GROW核查清单作为提交学术期刊的附件,以提高研究的标准和透明度。高质量的RWE研究对于改善患者治疗和推动治疗方法的发展至关重要,而ESMO-GROW指清单为实现这一目标提供了关键支持。尽管在实际应用中可能会面临一些挑战,但这一清单无疑将对肿瘤学研究领域的高标准发展产生深远的影响。
真实世界数据(real-world data,RWD)是指从电子健康记录(electronic health records,EHRs)、医疗索赔记录、患者登记信息、健康调查以及来自移动健康应用程序和可穿戴设备等非临床试验环境中获得的研究数据,这些数据反映了患者的治疗过程、治疗反应以及疾病的自然进展的医疗保健的真实情况[1]。由RWD提取的真实世界证据(real-world evidence,RWE)反映了医疗干预措施在现实世界中的效果和影响,为医学研究领域提供了有意义的见解和结论[2]。近年来,RWE在医学研究,尤其在肿瘤学研究中的应用重要性日益凸显,这一趋势不仅体现在相关学术论文的数量持续增长,也反映在RWD在医药监管领域中日益频繁的应用上[3-5]。尽管目前已经制订了多项与RWE研究报告相关的指南,但肿瘤学研究领域的独特性质,如特定变量、生物标志物的使用、治疗方法及其结果的多样性,以及人工智能(artificial intelligence,AI)、机器学习(machine learning,ML)和深度学习(deep learning,DL)等现代技术在RWE数据分析各阶段的应用,带来了新的挑战[6],这些挑战尚未在现有指南中得到充分解决。鉴于此,2023年11月欧洲肿瘤内科学会(European Society for Medical Oncology,ESMO)在Ann Oncol发表了首部肿瘤学RWE报告规范(ESMO guidance for reporting oncology real-world evidence,ESMO-GROW)[7],旨在提高肿瘤学RWE研究报告的完整性,提升基于RWD的肿瘤研究质量和透明度,并推动该领域研究的标准化。本文详细解读ESMO-GROW清单的核心条目,并结合实例进行分析,以助于国内研究者更好地理解和应用这一规范。
1 ESMO-GROW开发过程及内容
ESMO-GROW报告规范的开发是一项跨学科、多阶段的协作工作。首先,通过全面的文献回顾确认了肿瘤学领域对特定RWE报告规范的需求。4位作者基于文献检索起草了ESMO-GROW初稿。随后,通过包括来自临床肿瘤学、统计学、AI、数字健康等多领域的跨学科专家以及期刊编辑和审稿人的反馈,该手稿经过多次修订和完善。通过分组工作和定期会议,该报告规范逐步完善,并由核心团队统一整合。所有建议均通过投票确定,并在全天会议中讨论,以解决任何分歧并达成共识,如果>90%的作者同意该提案,则建议获得批准。此外,还考虑了外部利益相关者(患者权益倡导者、行业代表、欧洲药品管理局、出版商、AI、癌症数据库和健康政策方面)的个人专家的反馈。最终,通过所有作者的投票,形成了包含6个主题,35项条目组成的ESMO-GROW清单。
2 ESMO-GROW清单条目解读
ESMO-GROW清单共包含与RWE出版物各部分相关的6个主题:标题、前言、方法、结果、讨论和结论、最终考虑因素,共35条报告建议,具体内容见表1。

2.1 标题
条目1:根据研究内容,简明扼要地列出与研究类型、研究对象、研究目的、数据来源和研究结果有关的关键词。建议考虑加入“真实世界”或“观察性”等术语。
解读:在肿瘤学RWE研究的标题构建中,选取恰当的关键词至关重要。它们不仅反映研究的核心,还影响文章的可检索性。ESMO-GROW清单建议使用如“真实世界”或“观察性”等术语以明确研究类型,区分于例如随机对照试验的其他研究形式。此外,关键词还应细化至具体人群、肿瘤类型、研究环境和治疗方式等,以便快速传达研究的主要内容。同时,关键词的选择还应考虑期刊的字数限制和标题的吸引力。最后,研究设计的性质(前瞻性或回顾性)也是关键词选择的重要方面,可以为读者提供关于研究方法的线索。
2.2 前言
条目2:阐述研究问题的科学依据,并提供关于以往系统评价、Meta分析、临床试验和(或)RWE研究的核心证据的简明背景信息。
解读:前言部分的目的是提供关于研究领域已知信息的概述,并阐明激发研究设计的未满足需求和证据空缺。作者在撰写研究的前言部分时,首先应提供先前研究的证据总结,包括系统评价、Meta分析、临床试验和先前的RWE研究。这有助于构建研究的理论基础,并确保读者了解该领域的现状。其次,选择文献时应优先考虑高级别证据,确保研究基于最可靠和相关的信息。
条目3:识别证据中的差距,并解释为什么以及如何通过RWE研究来适当解决这些差距。具体说明当前研究预期产生的新证据。
解读:在确定研究的必要性时,关键在于识别和适当解决证据中的差距。具体来说有三点:首先,作者需明确研究领域中证据的不足,包括数量、质量和强度上的限制,及现有研究未解决的问题;其次,作者应阐释RWE研究可能的贡献,例如为通常被排除在临床试验之外的患者群体提供证据,或为合成对照组提供基础[8,9];最后,应讨论预期获得的新证据,包括RWE研究可能提供的证据类型以及其优缺点。
条目4:简要介绍研究目的。
解读:作者应在前言的结尾处陈述研究目的,根据研究设计的不同,可简明扼要地报告患者人群、暴露因素和结果。
2.3 方法
2.3.1 研究目的、设计、数据来源和变量
条目5:提出研究问题,包括对患者或研究对象以及目标结果的描述。
解读:研究问题的清晰陈述对于理解研究的目的和结果至关重要[10]。因此在描述研究问题时,ESMO-GROW清单建议作者考虑以下几个要点:首先,研究问题应明确且准确,以便读者能够清楚地理解研究目的和意图。如果有必要,可以提供与研究设计相关的具体信息,如人口统计学特征、肿瘤特性、研究环境等,以便提供完整的研究背景。如果研究目的是分析性的,可以采用患者或人群、暴露因素、比较组和结果(PECO)框架报告研究问题,以清晰定义研究的核心要素[11];其次,在解释性研究中,应报告感兴趣的暴露因素。在比较性研究中,应清楚说明比较组的性质;在预测性研究中,应详细阐述预测模型的开发、验证或探索预测因子的目的,还应报告所评估的预测因子;最后,作者应明确区分并详细描述主要和次要研究结果。
条目6:阐述研究目的,并考虑将研究类型归类为描述性和(或)分析性(解释性或预测性)。
解读:在肿瘤学研究中,清晰地表述研究目的以及准确分类研究类型不仅有助于研究设计的准确性,也对研究结果的解释和应用具有重要影响。研究目的通常可以分为为描述性或分析性(解释性或预测性)。描述性研究关注现象的特征或分布,如疾病流行率的评估,通常基于大量人群数据,无需对照组;分析性研究则探究变量间关系,包括因果关系(解释性)或预测未来事件(预测性)[12]。
条目7:提供相关信息,对用于解决研究问题的研究设计进行描述和分类。
解读:首先,作者需要根据研究的目的(描述性或分析性),选择适当的研究设计并进行详细描述。例如,对个体水平数据进行分析时,可能选择病例报告、横断面研究或队列研究;而对于人群水平数据分析,则可能采用生态学研究[13];若采用创新或特定研究设计,如准实验研究,需详细描述以便理解其特性和局限性;其次,应描述RWD在实验设计中的应用,如市场后监测研究、合成对照组和实用性试验和观察性研究。然后明确说明“前瞻性”和“回顾性”术语的具体应用,包括研究时间段、数据源和核心变量的时间点;最后作者可以考虑使用说明性图表来描述研究设计,帮助读者更好理解研究结构和流程。
条目8:明确界定用于选择研究对象或患者的资格标准,特别涉及与癌症相关的方面。
解读:在肿瘤学研究中,对患者或研究对象的选择标准进行清晰的定义,尤其是与肿瘤相关的方面,对于评估样本的内部和外部效度至关重要[14]。以下是对ESMO-GROW清单关于撰写资格标准的建议:第一应清晰描述包括纳入和排除标准以及时间框架的资格标准;第二对于基于个体的肿瘤学研究,应提供关于患者的人口统计学数据、肿瘤类型、组织学特征、疾病阶段、可能的生物标志物、先前治疗和共病情况等详细信息;第三如果研究对象是人群(例如,来自普通人群的共同特征个体的人群基础研究)或其他类型的数据(例如,药物警戒数据库中的事件),则应提供与该对象相关的资格标准;第四应明确规定纳入病例的时间;第五如果研究具有比较性,也应提供比较组的特征。在RWE研究中,资格标准通常比控制临床试验中的更为实用,通常允许更广泛的人群代表性(更高的外部效度)[15]。
条目9:报告所使用的RWD源的具体类型和目的,提供详细描述以解释选择该数据源以满足研究目的的原因。
解读:ESMO-GROW清单强调了对所使用RWD的类型和目的进行详细描述的必要性。首先,作者应清楚地描述数据源的主要收集目的和开始日期,尤其是那些常规收集的数据。这种描述不仅帮助读者理解数据的来源和性质,而且还揭示了数据集如何与研究目的和问题相适应;其次,作者应详细说明所选数据源是否适合解决特定的研究目的和问题;此外,作者还应详细描述所收集数据的一般类型,包括数据的完整性、数据库中患者的资格、卫生保健环境(如一级、二级或三级保健)、地理详细信息(如国家和地区),以及数据库是否覆盖所有患者或仅特定医院或患者群体。当数据是通过特定工具(如问卷)收集时,作者需要进一步说明这些工具的选择、设计和验证过程,确保数据收集方法的适用性和准确性;最后,如果数据采集方法涉及到新技术(如可穿戴设备),则应提供相同水平的详细信息。
条目10:当使用多个RWD源时,提供关于互操作性的详细信息,包括识别重复病例或从不同数据库链接数据的方法。
解读:在使用多个RWD源进行肿瘤学研究时,处理不同数据源之间的互操作性是一项关键任务。因此,在撰写文章时需要细致地处理和报告以下几个关键方面,以确保数据的准确性和研究的可靠性。第一,作者需要描述用于识别两个或多个可能包含重叠人群数据源中的潜在重复病例的方法,以及用于链接同一患者数据的技术和变量。这包括用于个体级数据的唯一标识符或用于区域级数据的匹配变量(如医院)。第二,如果不同数据源包含将被合并但编码方式不同的变量,作者应详细解释重新编码的原因和方法。第三,在处理数据集之间存在的数据差异时,应报告具体的解决方法,包括数据传输的标准和遵守可查找、可访问、互操作和可复用(findable, accessible, interoperable and reusable,FAIR)数据原则的方式;第四,如果使用通用数据模型来协调来自多个来源的数据,如观察性医疗结果合作伙伴通用数据模型,应提供相应模板或明确数据来源。
条目11:提供源数据和研究数据管理的详细信息及时间安排。考虑详细说明原始数据收集、更新、完整性、数据提取、清洗和(或)质量控制及验证的方法。
解读:确保数据准确性、完整性和研究透明度对提高结果可信度及易于验证和复制至关重要。因此,作者需要关注数据管理过程中的各个环节。首先,作者应该详细报告原始数据的收集、更新和完整性,这包括数据的来源、收集者、收集频率以及数据收集的方式(数字化或手动);其次,作者需要明确数据提取的具体日期,并采取质量控制措施,例如处理异常值和缺失值;此外,作者需要详细说明数据清洗和验证过程,以确保数据的准确性;最后,需要制订并执行保持数据最新的策略,特别是在变量更新和参考资料考虑方面,这对于理解和评估研究结果非常重要。
条目12:在正文或补充材料中提供数据库和(或)研究注册、管理、所有权、元数据和完整数据可获取性的核心细节。
解读:为了提高研究的透明度和可靠性,清单建议作者在正文或补充材料中提供关于数据库和研究注册的核心细节。首先,应提供包括识别信息(例如,研究缩写和注册识别号码)、参与的调查者和中心、完整变量信息(带注释的病例报告表)、数据匿名化程度、数据集访问政策、机构批准、伦理和数据保护批准(遵循一般数据保护条例和当地要求或其他适用数据保护法)等在内的全面信息;其次,研究方案建议列入补充资料,有助于读者更好地理解研究设计。此外,如果数据通过国际共享机制收集,或研究已在公共数据库注册,这些情况应被明确说明,并提供相关链接或识别码;最后,报告还应包括关于获取或免除知情同意的具体信息,以及如何处理各中心或国家间的差异。
条目13:确定每个核心变量的数据来源、定义,如果变量是衍生或编码的,描述衍生或编码是如何进行和验证的。
解读:ESMO-GROW清单建议作者在描述变量时考虑以下几个方面:第一,清晰地描述每个变量的定义和来源。这包括是否直接从数据源获取,还是通过某种衍生或编码过程得到。尤其对于主要变量如暴露和终点,应提供更为详尽的描述。第二,详细考虑每个变量可能受到的数据源特定偏倚。第三,如果变量是通过特定算法或过程衍生的,需详细描述其过程和验证方法。第四,在将变量进行编码(如将连续变量分为几个类别)时,应明确编码的逻辑和证据基础。此外,如果在不同的分析阶段采用了不同的编码方式,应提供明确的理由。这些详细信息都应在正文或补充材料中清楚描述。
条目14:明确核心变量与癌症病程相关的时间点。
解读:在肿瘤学RWE中,准确界定核心变量与癌症病程特定时间点的关系能够确保数据的相关性和解释性,提高研究结果的准确性和可比较性,并减少分析偏倚[16]。为此,建议作者在处理核心变量时,考虑以下几个关键方面:首先清晰描述每个核心变量与癌症病程中特定时间点的关系;其次当研究以癌症诊断或开始接受系统性抗癌治疗作为基线时间点时,应描述与诊断相关的因素和启动治疗的标准,如参与癌症筛查的情况、医疗获取途径和治疗方案等[17];然后作者应根据基线定义评估终点,报告标准和频率,并明确记录时间至事件变量的随访起止日期和终止情况;最后为了确保报告透明,详细的时间点信息应与变量列表一同报告,以便读者理解各变量与癌症病程的关系。
条目15:提供研究中包括的所有核心变量的完整列表,变量可以分为基线特征、暴露因素、结果或终点。
解读:作者在描述核心变量时需要特别注意以下几个关键方面:首先,作者应提供详尽的变量列表,这有助于读者全面理解研究设计、实施和结果;其次,需要细致描述基线样本特征,这对于评估样本是否能代表整个源群体极为重要[18];然后,还应阐明与癌症相关的变量,如原发性癌症诊断、肿瘤亚型、疾病阶段和既往治疗等,这对于调整研究设计以符合特定肿瘤学背景至关重要;此外,对于暴露变量,作者需明确识别和详细描述,以便于审查研究结论可能受到的潜在错误分类偏倚[19];最后,作者应明确界定研究的主要和次要终点,这有助于增强研究的目的明确性和分析深度。
条目16:在涉及生物标志物的研究中,需要提供关于生物标志物的描述、时间点、评估方法和分析验证的详细信息。
解读:在肿瘤学RWE研究中,生物标志物的详细描述至关重要,包括其特性、临床应用、评估方法和验证。免疫组化标记物的抗体信息、分子检测的样本类型和方法,以及影像生物标志物的类型和处理方法都需要详细说明,以增强研究的透明度和可重复性。
2.3.2 统计学分析与AI技术
条目17:概述统计分析的主要内容。
解读:在报告肿瘤学RWE研究中,对统计方法的明确描述极为重要。对于描述性研究,作者需要详细说明如何使用集中趋势和离散趋势的度量方法来总结原始数据。而在分析性研究中,则要求作者在正文中详细报告与研究问题相关的统计分析,并在补充材料中提供完整的统计分析计划(statistical analysis plan,SAP)。
条目18:提供有关研究预先计划的样本量要求和统计功效的详细信息(如适用)。
解读:根据研究目的,作者应详细报告所需样本量和估算的统计功效,包括主要终点、对照值估计、目的可检测差异、效应大小、最小功效、显著性水平以及采用的统计检验。这些信息对于理解研究的可靠性和结论的有效性至关重要。
条目19:具体说明为识别和减少主要偏倚来源而预先计划的策略。
解读:科学研究中的偏倚可能影响结果的准确性和研究的有效性。因此,为了控制研究中的偏倚,建议作者应首先描述可识别到的可能影响结果的潜在偏倚,如样本选择、数据收集或测量方法;其次,描述为减少这些偏倚所采取的措施,包括使用匹配和分层方法来平衡不同组别、统一方法和设备以减少异质性,应用多种统计方法评估干预效果,处理时间性偏倚以及恰当地处理缺失数据等。
条目20:明确区分预设分析和事后分析,尤其是在亚组分析中。
解读:建议作者优先考虑预设分析,未在最初的SAP中预先声明的事后分析应在报告时明确标记,并强调它们的探索性目的。在报告亚组分析时,作者应详细说明进行亚组分析的数量和呈现的数量,说明感兴趣的终点和用于评估干预或暴露差异的异质性的统计方法。此外,为了控制研究的总体错误率并保证结论的稳健性,对于解释性研究中的多重性问题的调整措施,作者也应给予报告。
条目21:提供关于内部和外部效度的信息,以及所有敏感性分析的相关信息。
解读:内部和外部效度以及敏感性分析的报告是确保研究质量的重要组成部分。内部效度关注研究方法的准确性和执行的质量,确保结果的可靠性;外部效度则涉及结果的普遍适用性[20]。敏感性分析用于检验结果的稳健性,有助于识别偏差和不确定性。作者应清楚地描述敏感性分析的方法和目的,透明地展示在不同假设情况下对结果的影响。
条目22:对于分析性研究,应在补充材料中提供SAP的完整版本,包括对任何修改的简要说明。
解读:SAP是研究设计的一个关键组成部分,它详细阐述了研究的统计方法和原理、目的研究人群及分析策略[21]。它为研究提供了一个明确的分析框架,确保研究的方法学严谨性。ESMO-GROW清单建议分析性研究中应在补充材料提供SAP的完整版本。如有任何修改,也应在报告中进行简要说明。
条目23:说明使用了哪种ML、DL或其他AI方法(如适用)。
解读:AI技术,尤其是ML和DL,已成为数据分析的强大工具,能够揭示传统统计方法难以捕捉的复杂模式和关联[22]。在肿瘤学研究中,这些技术尤为重要,因为它们能帮助从RWD中生成有价值的假设,并指导临床决策[23,24]。在报告这些方法的应用时,作者应详细记录AI算法的使用和任何对标准算法的修改,并建议将AI方法与传统统计方法进行比较,以展示其性能优势。
条目24:在使用AI算法(如ML和DL)报告RWD分析时,需包含关于数据预处理技术、特征工程策略和模型开发的详尽信息。
解读:ESMO-GROW清单建议作者使用AI算法之前详细记录数据预处理技术、特征工程策略和模型开发的全过程。这包括数据的收集、准备、清理、转换、探索性质量控制、标准化、插补、注释和编码标准等步骤。同时,应明确说明患者的纳入和排除标准。如果适用,在处理AI算法分析中,作者应包括对不同患者亚组的考虑,确保训练集的平衡性,特别是对于有共病或罕见肿瘤的患者。对于代表性不足的人群,可能需要生成合成数据。使用来自多个来源的数据集时,应描述数据整合的技术平台或方法。如果应用了如联邦学习等数据隐私保护框架,也应明确其部署类型;此外,作者应详细说明模型开发的每个步骤,这包括训练、验证和测试数据集的构建,以及特征选择、模型调整和正则化及防止过拟合和欠拟合的措施;最后作者应对所建立的模型进行性能评估,包括区分度和校准的评估,以及在外部数据集上的前瞻性验证。
条目25:阐述AI模型的可解释性和可解读性,介绍与临床实践相结合的计划(如适用)。
解读:医学研究中,可解释和可解读性的AI模型能够让医生和研究者理解模型是如何做出预测的,这对于建立信任和确保模型应用的适当性至关重要[25]。首先,要求作者在进行涉及AI模型的研究时,采用诸如可解释性AI技术的方法来阐释模型的工作机制;其次,作者应使用清晰的术语,以便目标受众(例如医疗专业人员)能够理解;最后,如果研究中的AI模型将被用于临床应用,作者应详细介绍模型在临床环境中的应用计划,包括其与现有医疗实践的结合方式、预计的部署时间线,以及相关的技术和安全性考虑。
条目26:简要描述研究所需的多学科团队,并解释这些需求是如何得到满足的(如适用)。
解读:对于肿瘤学RWE研究中涉及的多学科团队,作者可以在方法部分或者补充材料中简洁地报告。
2.4 结果
条目27:提供在样本选择的每个阶段被排除或未参与的病例数量及原因,以及随访过程中失访的病例数量。将被排除的病例与纳入分析的病例进行比较,并用流程图展示。
解读:在科学研究中,明确样本选择的每个阶段被排除或未参与的病例数量及原因对结果的可解释性至关重要,有助于提供对数据质量和潜在偏差的见解,以及复制工作和与其他研究的比较[26]。此外,比较被排除的病例与纳入分析的病例有助于评估选择偏倚和结果的普适性。这些信息应在流程图中展示,并在必要时提供详细比较。
条目28:详细描述纳入病例的基线特征(如临床人口学特征和肿瘤特征),应对分析中的不同组别的基线特征进行比较(如适用)。
解读:关于研究的基线特征,首先作者应通过表格形式清晰地展示这些基线数据,并根据研究设计的需要,对比不同组别(如暴露组和对照组)的特征;其次对于涉及比较性分析的研究,建议作者应详尽地报告各组间的特征对比,包括频率、比例、集中趋势和离散程度;此外考虑到缺失数据可能对分析结果产生的潜在影响[27],作者应详细说明每个相关变量及按研究组别的缺失值比例;最后在某些情况下,如使用倾向性评分,还建议作者增加额外的表格(通常作为补充资料),以展示分析前后的标准化差异。
条目29:报告研究的主要分析结果,简要描述相关的探索性分析(预先设定和(或)事后分析)的结果。提供读者获取完整结果的详细信息。
解读:报告肿瘤学研究的主要分析结果时,作者应详细描述主要结果、变量缺失数据、中位随访时间及每个分析组的事件数量和时间点。提供总结测量及置信区间,并报告单变量和多变量分析的相关数据。探索性分析结果应视为辅助内容,需要谨慎处理和解释。
2.5 讨论与结论
2.5.1 讨论
条目30:总结针对主要研究问题的核心结果,并根据有关该主题的现有最佳证据对数据进行客观讨论。避免随意选择文献来支持某个观点。
解读:在讨论肿瘤学研究结果时,作者应客观总结与研究目的相关的核心结果,并基于现有最佳证据进行讨论。还应在讨论开始时简要说明支持性文献的选择方法,以确保透明度。
条目31:讨论当前研究的优点和局限性,包括主要偏倚、应用的策略如何有助于避免或减少偏倚,以及作者估计残差偏倚可能会影响研究的核心结果(如适用)。
解读:在讨论肿瘤学研究的优点和局限性时,作者应强调研究的优势并总结可能影响结果的主要偏倚。描述用于减轻偏倚的方法,并承认观察性研究的潜在偏倚风险。
条目32:讨论研究结果的可推广性及其对临床实践、卫生政策或公共卫生的潜在影响,以及对未来研究假设的形成。
解读:在讨论肿瘤学研究结果的可推广性时,重要的是平衡地评估结果对临床实践和卫生政策的潜在影响,同时考虑其对未来研究方向的贡献。重点应放在统计显著性与实际临床意义之间的关系,以及研究结果如何促进新的临床和政策决策。
2.5.2 结论
条目33:全面总结与主要研究问题相关的核心结果,以及对临床实践、卫生政策和(或)公共卫生的主要影响。基于报告研究中尚未满足的需求和局限性,提出进一步研究的建议。
解读:结论部分是研究报告的关键,它应精确总结核心研究发现,评估其在临床和公共卫生领域的影响,并指明未来研究方向。作者应强调主要结果的临床和政策相关性,同时清晰地指出研究的局限和未来研究的潜在领域。结论应避免过度阐释,确保简洁和针对性。
2.6 最后考虑事项
条目34:注明所有相关的研究赞助以及直接和(或)间接或实物资助。
解读:作者应透明地声明所有研究赞助来源,无论是直接资金支持还是间接或实物资助。透明地揭示赞助来源对于保持研究的公正性和客观性至关重要。这包括明确指出赞助来源如何影响研究的各个阶段,从而帮助读者理解潜在的利益冲突,并评估研究结果的可信度。若无赞助或资助,亦应明确声明,以确保完整的透明度。
条目35:根据期刊规定,详细说明所有相关的致谢、作者声明、个人贡献以及其他最后考虑事项。
解读:在肿瘤学研究报告的最终阶段,作者应根据期刊的具体规定详细说明所有相关的致谢、作者声明、个人贡献以及其他重要事项。此外,如果使用了AI辅助技术进行手稿开发或修订,也应在相关部分进行说明。
3 实例解读
本文以2023年发表在WILEY Cancer Medicine上的研究“Apalutamide for prostate cancer: multicentre and multidisciplinary real-world study of 227 patients”为实例[28],对照ESMO-GROW清单条目,逐一解读其内容,评价结果见表1右半部分。总体而言,实例文章在多个方面表现良好,包括清晰地定义研究问题、目的、设计和患者纳入标准。它也详细描述了所使用的RWD源和统计分析方法。然而,实例文章可能需要进一步强化对数据源特点和数据管理细节的描述,以及提供更全面的关于数据互操作性和数据提取的信息。此外,对于涉及的生物标志物,实例文章也许可以提供更多关于评估方法和分析验证的细节。在讨论部分,这篇研究充分讨论了其研究结果的意义和潜在的局限性,但还可以进一步探讨其研究结果对临床实践和公共卫生政策的潜在影响。因此,本实例虽部分符合ESMO-GROW清单,特别是在明确表述研究问题和目的方面,但在描述数据源特性、数据管理细节以及数据互操作性等方面仍有改进空间,以提高报告的规范性和完整性。
4 小结
ESMO-GROW清单的推出是肿瘤学领域RWE研究的重要转折点。随着日常临床实践对治疗效果全面理解需求的增加,RWE的重要性愈发突出。这一规范不仅满足了对详尽肿瘤学数据报告的需求,而且代表了医学研究方法的进步。ESMO-GROW清单提供了关于特定变量、生物标志物、治疗方法和AI、ML、DL技术应用的具体指导,对肿瘤学研究的发展起到了重要推动作用。
然而,这一指南在实际应用中可能面临挑战。肿瘤学的特殊性和复杂性,以及技术的快速发展要求其具有灵活性和适应性。随着科技的进步和临床实践的变化,该指清单可能需要定期更新,以保持准确性和相关性。建议将ESMO-GROW核查清单作为提交学术期刊的附件,以提高研究的标准和透明度。高质量的RWE研究对于改善患者治疗和推动治疗方法的发展至关重要,而ESMO-GROW指清单为实现这一目标提供了关键支持。尽管在实际应用中可能会面临一些挑战,但这一清单无疑将对肿瘤学研究领域的高标准发展产生深远的影响。