中国卫生发展绿皮书:卫生技术评估专题研究
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第一章 药品临床综合评价研究(肿瘤、心血管、儿科评估核心内容、指标和方法)

第一节 药品临床综合评价研究

药品是保障群众健康、挽救生命的关键医疗技术,其监管与应用受到WHO及包括我国在内的各国政府的高度关注。国际上超过50个发达及发展中国家建立了以卫生技术评估制度为核心的药品临床综合评价制度,为优化临床用药、发挥创新药品最大价值、有效控制药品费用不合理上涨等问题,提供了坚实的证据基础。针对临床用药不规范、处方行为差异大、药品供应保障政策不完善,严重影响治疗质量和效果乃至医药费用等,有必要加快推进药品综合评价工作,满足全面深化医改需要,助力健康中国建设目标实现。

本章系统介绍了我国药品临床综合评价体系及主要工作,包括其对于国家药物政策及基本药物制度的支撑作用。

一、药品临床综合评价概述

药品临床综合评价是药品供应保障体系和制度建设的重要内容,在综合循证医学、流行病学、临床药学和医学、经济学等知识体系基础上,利用药品常规监测工具及卫生技术评估方法和工具,汇总分析药品临床应用数据,对药品应用价值进行综合评价及判断。

(一)药品临床综合评价的目的和意义

药品临床综合评价是促进药品回归临床价值的基础性工作,是巩固完善基本药物制度的重要措施,是健全药品供应保障制度的具体要求。《“健康中国2030”规划纲要》《“十三五”卫生与健康规划》《“十三五”深化医药卫生体制改革规划》等文件对药品使用监测和临床综合评价提出了明确要求,新一轮党和国家机构改革将开展药品使用监测和临床综合评价确定为卫生健康部门的法定职责。2018年,国家卫生健康委启动药品临床综合评价体系建设工作,并启动重点领域的药品评价工作,要求以基本药物为重点,加快推进评估结果在药物遴选、国家药物政策拟定、药品分类采购、短缺药品管理及儿科和重点慢性病人群诊治服务优化方面的应用。

药品临床综合评价是药品供应保障体系及制度建设的重要内容,判断已上市药品在临床环境中的安全性、有效性、成本-效果及公平可及性,使药品最大限度地满足治病救人的基本健康需求。在此背景下,国家卫生健康委2018年制定了《国家药品临床综合评价总体工作方案》,并起草了《国家药品临床综合评价管理指南》。

药品临床综合评价涉及临床医学、药学、流行病学、统计学、经济学、卫生技术评估、政策评价等多个学科知识,是多方参与、综合全面、兼容并蓄的综合性工作。药品评价的开展,不仅可确保临床用药的安全性、规范性、适宜性,促进药品合理使用,还可支持基本药物的遴选调整、供应保障、医疗服务质量改善和价值提升、医药产业创新发展等重大医药政策的制定与完善,为定价及支付等决策的科学制定提供建议,为临床医生、药师、患者及其家属提供准确的药品及药品应用信息。

(二)药品临床综合评价的内容与作用

1.药品临床综合评价

国家药品供应和保障体系是个复杂庞大的体系,包括政策、服务和贸易等核心组成部分。为了全面管理药品服务和市场,许多国家均在开展药品领域评估工作,支持药品政策制定、实施和调整。

药品临床综合评价是运用卫生技术评估方法,融合循证医学、流行病学、临床医学、临床药学、循证药学、药物经济学、卫生技术评估等知识体系,综合利用药品上市准入、大规模多中心临床试验结果、不良反应监测、医疗卫生机构药品使用监测、药品临床实践“真实世界”数据以及国内外文献等资料,围绕药品的安全性、有效性、经济性、创新性、适宜性、可及性等进行定性、定量数据整合分析。

建立临床药品综合评价体系的核心是建立临床药品综合评价机构,并通过建立评估选题机制、选择适宜的评估措施和方法、建立公开透明的评估流程、综合临床、经济和社会价值判断结果等方式,不断完善药品临床使用效果和效率,推动符合成本-效益的创新药品的生产和使用,确保居民获得物美价廉的放心药。

为了满足卫生系统改革的需要,缓解医疗费用支出的压力,发达国家和部分发展中国家近年来纷纷建立卫生技术评估体系和制度,建立科学、公开、透明的评估流程,系统推动药品评估结果支持基本药物遴选、支付定价等政策制定。相比药物经济学,卫生技术评估重视技术的行业和社会适宜性的讨论,更符合公共政策制定的公平合理原则,近年来逐步成为药品临床综合评价的核心工具。

全球50多个国家建立了卫生技术评估机构,形成了配套管理体系和部门协调机制,将评估证据用于新药研发、药品注册申请、基本药物目录制定、药品报销、药品定价、制定临床用药指南和诊疗规范、公共卫生资源配置等药物政策制定过程中。

我国自20世纪90年代引入卫生技术评估,至今已有近30年历程(图1-1-1)。

图1-1-1 我国卫生技术评估发展历程

2.药品临床评价核心内容

由于各个国家的国情不同,医疗卫生体制不一,卫生政策的差异,药品临床评价所涉及的领域及内涵也有所不同,但核心内容集中在以下4方面(表1-1-1)。

表1-1-1 药品临床评价核心内容

(三)药品临床综合评价的应用与价值

国际经验表明,药品评价对于扩大基本药品供给、改善医药卫生服务质量、优化医药资源价值方面具有较大决策支撑作用。在我国,药品临床综合评价已初步应用在基本药物为核心的基本用药目录制定与调整、规范临床用药等方面,对提升药品价值、驱动创新和产业升级发挥了作用(图1-1-2)。

图1-1-2 药品临床综合评价的应用与价值

(四)我国药品临床综合评价管理架构及职能

我国药品临床综合评价遵循政府主导、需求导向、科学规范、公开透明等基本原则。现阶段药品临床综合评价在国家卫生健康委药政司指导下,评价的主要目的是以药品治疗疾病的本质属性为依归,以基本药物和儿童、重大慢性病患者等特殊人群用药为重点,以药品临床实际价值为导向,以大数据为分析评价基础,建立综合性评价工作规范,科学、准确、客观地指导综合评价实施及结果转化,全面支持医药治理体系的完善、医药卫生资源的优化配置、药品供应保障能力的提高。

参与药品临床综合评价的各单位分工如图1-1-3所示:

图1-1-3 药品临床综合评价主要机构及职能

二、药品临床综合评价的发展历程

(一)基于卫生技术评估(HTA)的药品临床综合评价国际发展历程

1.药物经济学评价

20世纪50年代起,国际上逐渐出现了药品经济性评价学科。药物经济学评价是基于经典福利经济学理论发展起来的应用经济学、流行病学、决策学、生物统计学等多学科研究方法,识别、测量和比较不同药物、治疗方案及卫生服务项目的成本和社会经济效果,有效提高医药资源的配置和利用效率的评价技术。

经过近半个世纪的发展,药物经济学评价已经形成了一套比较完整的评价体系,在国际广泛应用。澳大利亚、加拿大、英国、美国、法国、荷兰等20多个国家先后颁布了药物经济学评价指南,我国药学会也在2011年颁布了《中国药物经济学评价指南》,为指导药物经济学在临床的应用和开展提供了理论和方法学支持。

目前全球多个国家引入药物经济学,用于新药研发、药品注册申请、基本药物目录制定、药品报销、药品定价、制定临床用药指南和诊疗规范、公共卫生资源配置等药物政策制定过程中。根据WHO报道,全球134个国家建立实施了基本药物目录,各国普遍面临合理选择抗肿瘤药品、孤儿药和心脑血管药品等高成本药品的巨大挑战,发达国家和部分发展中国家近年来纷纷建立卫生技术评估体系和制度,建立科学、公开、透明的评估流程,系统推动药品评估结果支持基本药物遴选、支付定价等政策制定。

2.卫生技术评估

近年来,越来越多的国家在药品评价中运用卫生技术评估的方法,以更好地支持药品监管、应用、定价和准入决策的制定。卫生技术评估(health technology assessment,HTA)是一种国际上常用的政策分析工具,综合运用多学科方法,用以评价卫生技术(包括:药品、设备、临床诊疗技术、医疗支撑体系和组织与管理体系等)应用所产生的临床、经济、伦理和社会等多方面的效果和影响,特别是对这些技术的应用可能产生的间接影响和远期社会影响进行系统研究,为优先政策领域确定提供循证证据。

卫生技术评估作为卫生政策制定和分析工具,其目的是协助决策者确定卫生技术推广的优先领域,提高卫生资源配置和使用效率,为各层次的决策者提供合理选择卫生技术的科学信息和决策依据,对卫生技术的创新研发、临床应用、推广与淘汰提供决策依据,为卫生和医保决策者及医药卫生人员提供合理选择卫生技术的科学信息和循证依据,支持卫生资源合理配置,帮助提高有限卫生资源的利用质量和效率。

(二)国际卫生技术评估体系

1.国际卫生技术评估体系的建立

卫生技术评估(HTA)最早起源于20世纪60年代的美国的公共部门,之后逐渐被英国、澳大利亚、加拿大等OECD国家及南美和亚洲部分国家采用,作为医药技术管理的核心制度,支持药品评价的开展。经过近 40 年的发展,已经波及全世界。

全球50多个国家均建立了卫生技术评估机构,形成了配套管理体系和部门协调机制,将卫生技术评估作为支持药品诊疗服务优化、合理定价和补偿、控制不合理医疗费用增长和提升医疗资源配置和使用效率的关键技术手段。多数国家从立法和政策高度规定了HTA在卫生政策制定中的作用,在中央或联邦层面建立具有独立法人资质的HTA研究机构。例如,英国卫生与社会服务优化研究院(National institute for Health and Care Excellence,NICE)是英国卫生部建立的具有独立法人资质的评估机构,代表政府从事卫生技术评估工作,为政府决策提供技术支撑。立法赋予NICE技术评估和基于评估结果制定医疗服务指南的职责,管理新技术的准入,英国国家医疗服务体系(National Health Service,NHS)在纳入新医药技术时必须经过NICE的推荐。由于NICE制定的指南和技术评估报告具有法定效力,NHS依据NICE推荐的技术提供资金支持,从而提高了NHS资金使用效率和决策质量。瑞典、加拿大等欧美国家还依托地方HTA机构建立全国性HTA工作网络,以支持地方层面的循证政策制定。在这些国家,HTA结果常用于开发临床指南,管理新医药技术,制定药品价格和医保报销政策等。

2.中国卫生技术评估体系的建立

我国自20世纪90年代起引入HTA,国家卫生健康委卫生发展研究中心于2009年成立了卫生政策与技术评估组织参与原卫生部“十二五”规划教材《卫生技术评估》《卫生技术评估理论与实践》等专著工作;同时与国际组织和帝国理工等大学合作,开展HTA能力和机制建设,为国家药品临床综合评价体系建设力量。

承担HTA教学和评估工作的机构还包括中国医学科学院医学信息研究所、上海复旦大学卫生技术评估重点实验室、四川大学华西医学院中国循证医学中心等。随着医院层面卫生技术评估技术的引入,北京、上海、成都等地大型综合医院药学和设备科室开始尝试用卫生技术评估方法开展药品和器械评价。

国家卫生健康委卫生发展研究中心于2018年承担了“国家药物和卫生技术综合评估中心”的工作(国卫科教函〔2018〕234号),旨在建立我国卫生技术评估体系,负责组织、协调、推动药物和卫生技术评估项目实施,研究制订评估标准、评估质量控制指标体系,推动我国卫生技术评估工作规范发展。

国内外卫生技术评估发展历程见图1-1-4。

图1-1-4 国内外卫生评估发展历程

(三)国内外卫生技术评估体系发展经验

本小节对国内外卫生技术评估发展历程、国际卫生技术评估组织、国际典型国家卫生技术评估体系进行概述。

1.卫生技术评估发展历程

纵观卫生技术评估发展历程,方法学体系经历了一个逐步完善的过程。在20世纪70年代,HTA研究主要关注技术安全性评价,80年代侧重费用和成本-效益的经济性评价,90年代关注伦理影响,进入21世纪后关注患者、公众等参与价值讨论。评估的重点也从早期局限于大型、先进技术设备扩展到微型技术、软技术、心理咨询服务等,评估的内容也涉及更广泛的领域,如体制、社会、伦理等的适应性。归纳起来,卫生技术评估关注卫生技术的安全性、有效性、经济性和社会伦理适应性,可根据评估目的,选择不同的评估内容。

经过40年的发展,卫生技术评估逐渐被社会所接受,已经初步形成了独立的学科体系;各国建立的国家与地区级卫生技术评估机构不断增加;评估程序更加透明,研究对象领域从单一的医疗技术涉及卫生健康领域的许多方面,更加强调评估方法的科学化和标准化;更加注重结果的传播和政策转化;更多依赖数据库、电子病案、互联网及其他信息资源;更加注重大范围的评价,出现越来越多的国际协作。从全世界范围来看,鼓励和支持广泛开展卫生技术评估已成为各国卫生体系优化资源配置和利用、提高体系效率的重要举措。

经过40年的发展,卫生技术评估逐渐被社会所接受,已经初步形成了独立的学科体系;从全世界范围来看,鼓励和支持广泛开展卫生技术评估已成为各国卫生体系优化资源配置和利用、提高体系效率的重要举措。

2.国际卫生技术评估组织

世界卫生组织(World Health Organization,WHO)鼓励各国建设卫生技术评估体系,2014年,第67届世界卫生大会上通过了关于《为实现全民健康覆盖(UHC)开展卫生干预与技术评估决议》,敦促成员国加强卫生技术评估发展与应用,优化医疗资源配置和使用,早日实现全民健康覆盖。

随着各国卫生技术评估的发展,国际间的协作愈加普遍,先后成立了一些卫生技术评估的国际组织,如国际卫生技术评估协会(International Society of Technology Assessment in Health Care,ISTAHC)、国际卫生技术评估机构网络(International Network of Agencies for Health Technology Assessment,INAHTA)、卫生技术评估国际网络(Health Technology Assessment International,HTAi)等。这些国际组织在世界范围内推广卫生技术评估理念,确立共同关注话题,建立评估数据库,举办专业杂志,在促进国际合作交流作出重要作用。

2003年,由国际卫生技术评估领域的专业学者和科学家组成了HTAi国际社团,目前成员单位遍布全球64个国家,年度会议有近千名业内专家参加,国家卫生健康委卫生发展研究中心和卫生技术评估重点实验室等政策研究部门及高校,每年都持续派员代表中国参加大会,并就不同主题进行学术交流和报告汇报。

2004年起,泛美卫生组织(Pan American Health Organization,PAHO)发布了一系列卫生决议,旨在推动南美各国建设卫生技术评估体系。决议建议所有成员国将卫生技术评估结果系统地应用于各国卫生发展和改革中。

2006年,欧盟委员会建立欧盟国家卫生技术评估协同机制,便于各成员国更好地协同发展卫生技术评估,服务本地区卫生决策。

同时,亚洲地区的卫生技术评估也在蓬勃发展中。2012年,新加坡、泰国、马来西亚、中国(含中国台湾)、韩国和日本等主要的卫生技术评估机构成立了亚洲卫生技术评估组织(HTAsiaLink)。HTAsiaLink通过组织亚洲国家决策者、研究者的交流和合作,助力各国循证决策。卫生发展中心代表中国卫生技术评估机构参与了HTAsiaLink的筹建。

2013年,国际药物经济学和结果研究协会(ISPOR)建立了卫生技术评估分会和亚洲卫生技术评估网络,关注卫生技术评估能力建设与经验分享,显示出ISPOR对于亚洲和中国卫生技术评估的关注。

WHO鼓励各国建设卫生技术评估体系,2014年,第67届世界卫生大会上通过了关于《为实现全民健康覆盖(UHC)开展卫生干预与技术评估决议》,敦促成员国加强卫生技术评估发展与应用,优化医疗资源配置和使用,早日实现全民健康覆盖。

3.典型国家卫生技术评估体系概述

受政治体制、文化思想、经济社会发展水平等因素的影响,不同国家的医疗卫生体制不尽相同。各国在不同的历史发展时期,卫生健康发展策略也不尽相同,各国卫生技术评估体系建设情况差异很大。总体看,绝大多数的发达国家都建立了较完善的卫生技术评估体系,用于增强本国卫生资源的合理配置和利用能力,但发展中及不发达国家由于卫生管理体系不健全,精细化管理能力薄弱,尚未建立完善的卫生技术评估体系。

目前,全球近50个国家建立了卫生技术评估工作机制、规范的流程和相关研究机构,为这些国家的卫生决策提供了重要的证据支撑。卫生技术评估作为医疗资源配置的重要信息来源已成为政府指令性日常工作,作为医疗资源配置的重要信息来源,帮助政府进行循证卫生投入和撤资决策。

很多国家从立法和政策高度规定了HTA在卫生政策制定中的作用,在中央或联邦层面建立具有独立法人资质的HTA研究机构。为了更好地满足地方决策者的循证决策需求,很多国家还建立了地方层级的HTA机构或全国性HTA工作网络,以支持地方层面的循证政策制定。总体来看,各国HTA结果常用于管理医药新技术,制定药品价格,开发临床指南和医保报销政策等方面。

以下是主要国家卫生技术评估体系建设和工作情况:

(1)英国:

英国的卫生技术评估活动非常普及,已成为世界上卫生技术评估活动开展得最好,投入资金最多的国家。1993年,英国卫生技术评估项目被正式列入卫生部的研究和发展计划,并成立了国家卫生技术评估委员会,下设一个卫生技术评估合作中心及一些分中心。中心人员主要由大学或研究机构的卫生技术评估研究人员和卫生技术评估咨询机构的从业人员组成,旨在促进NHS的临床和管理决策中的应用,并扩大其影响。1998年,英国NHS建立了国家卫生和临床诊治技术优化研究院(NICE),负责制定诊疗和公共卫生服务指南,建立质量标准。NICE实行董事会管理,董事会由卫生国务秘书任命。NICE根据主题组建卫生技术评估项目组撰写技术评估报告,有关结果征求各方意见后由NICE正式签发,NHS医疗机构负责执行。

(2)美国:

1967年,美国国会提出应用卫生技术评估进行医疗决策,并成立技术评估办公室(OTA)负责开展卫生技术评估。在医药企业施压下,2005年OTA解散。2010年3月,美国国会通过卫生改革法案,成立患者健康结果研究院(PCORI),负责监管临床效果研究。目前,美国开展卫生技术评估的机构较多,包括医院、美国医学会、医师协会、国家医疗保险机构、私营保险机构及医药咨询和投融资公司等,多数采用二次研究证据综合评估,开展卫生技术评估目的主要包括投资决策、成本控制和适宜技术选择等。由于卫生系统机构松散,私营机构占据主导地位,企业成为卫生技术评估活动重要的投资者。多数美国医院针对医疗设备采购都建立了专门的资金预算程序,结合卫生技术评估证据制订设备采购计划。一些医院和卫生机构还成立了专业卫生技术评估委员会,建立了新技术应用的决策程序。

(3)澳大利亚:

澳大利亚被公认为是充分利用技术评估信息进行决策的典范。20世纪80年代初期,澳大利亚开始引进卫生技术评估,1998年建立了第一个政府资助的新医药技术评估项目,利用有关评估结果制定医保药品目录,及管理新设备和新技术医保准入。澳大利亚主要的卫生技术评估机构有:药品福利咨询委员会(Pharmaceutical Benefits Advisory Committee,PBAC)、澳大利亚处方药物评估委员会(Australian Drug Evaluation Committee,ADEC)、非处方药物评审委员会(Medicines Evaluation Committee,MEC)、传统医药评审委员会(the Complementary Medicines Evaluation Committee,CMEC)和医疗服务咨询委员会(Medical Services Advisory Committee,MSAC)。PBAC建立于1944年,主要负责管理处方药物目录,旨在提高处方药应用效率。1953年,PBAC建立了一个具有法律效力的独立的专家委员会,向原卫生部提供关于药物(或疫苗)成本-效益方面的建议。未经PBAC评估的药品一律不得进入药品报销目录。1963年ADEC建立,负责对处方药的质量、风险-收益、效率和可及性进行评价,同时从医疗角度和科研角度对新处方药的注册申请书进行评价。1998年MSAC建立,MSAC的主要作用是向澳大利亚卫生与老年部提供有关新的医疗技术和程序的安全性、有效性、成本-效益等方面的研究证据。卫生部门根据MSAC提供的证据和信息做有关新技术和现有的医疗技术的投资和撤资决策。

(4)加拿大:

加拿大联邦政府层面于1989 年成立加拿大卫生技术评估协调办公室(Canadian Coordinating Office of Health Technology Assessment,CCOHTA),1993年,该机构成为国家指定的卫生技术评估中心。省级相继成立了政府基金支持的地区性卫生技术评估机构,支持省级卫生决策。2006 年,CCOHTA正式更名为加拿大药物和卫生技术局(Canadian Agency for Drugs and Technologies in Health,CADTH),由联邦和各省(除魁北克外)联合资助,负责开展卫生技术评估项目,传播和推广使用卫生技术评估结果,完善方法学和制订指南,协调省级卫生技术评估机构和加强对外交流合作等。CCOHTA主要开展了医保药物评价和处方集建立及应用评价工作。

(5)瑞典:

1987年,瑞典成立了国家级卫生技术评估机构,即瑞典保健技术评估委员会(Swedish Council of Technology Assessment in Health Care,SBU),成为最早实施卫生技术评估的国家之一。主要任务是为瑞典政府和县议会提供新兴和现有医疗技术的评估结果,以改善卫生服务体系效率和公平性。SBU主要通过系统文献综述开展评估,辅以专项调查及其他原始数据的收集方法。在瑞典政府和国会的鼓励下,SBU近年将精神卫生保健和社会服务纳入卫生技术评估视野,使卫生技术评估应用范围更为广泛。标志着卫生技术评估获得国家高度认可。瑞典政府重视科学决策,有力地推动了卫生技术评估的发展。

(6)德国:

2004年,建立独立的卫生技术评估实体机构卫生保健质量和疗效研究院(IQWIG),其功能和建制模仿英国NICE,负责药品、操作、临床指南等研究,为卫生决策提供证据支持。2011年初,新一轮德国医药卫生改革出台了新药定价和医保报销策略,并立法推行以价值为主的药品定价原则,使德国医药企业不能再自由定价。该政策提出,医药公司在拿到新药上市许可后必须马上向国家公共委员会(G-BA)提交药品价值档案,经与国家法定保险公司(SHI)谈判后确定药价。这一新举措迫使很多医药公司大幅度降低药价。

(7)泰国:

2007年,成立泰国卫生干预措施和技术评估项目(HITAP),HITAP隶属于公共卫生部常务秘书处政策战略局,负责评估药品、器械、临床操作、公共卫生等。主要开展四类卫生技术评估研究:①基础体系的建设和研究;②能力建设;③模型研究;④未来发展研究。为了加强公众教育,HITAP开展了大量沟通传播活动,包括通过发表国内外期刊文章、印制宣传彩页和做媒体专访等方式公布卫生技术评估研究结果,积极促进民众参与政府卫生工作的绩效评估等。

(8)韩国:

2009年,成立国家循证医疗合作中心(NECA)。作为独立法人机构,NECA和韩国卫生福利部建立合作关系,旨在为卫生决策提供科学证据,以改善居民健康水平,提高医疗资源利用效率。该中心下设四个分中心,分别开展以下四类研究:①卫生技术评估;②宏观卫生研究;③快速评估研究;④新技术评估研究。卫生福利部负责公布NECA新技术安全性和有效性研究结果,并根据相关信息做保险报销决策。NECA还负责传播和沟通。主要传播途径包括网页宣传、双月刊刊物《证据和价值》、评价委员会会议和不定期圆桌会议、研究方法培训会等。

(9)马来西亚:

1995年,马来西亚卫生部建立了卫生技术评估处,该处目前已发展成为一个人员众多、资金雄厚的重要职能部门,为公立和私立部门提供有关药品、器械、临床操作、支撑体系和架构(如电子病历系统和日间手术等)等现有和新技术的评价工作。截至2016年底,卫生技术评估处完成了近百个评估项目,撰写了140个快速评估报告,为国家出台卫生相关政策、制定临床操作指南、规制药品和医药广告提供证据支持,同时还为国家终止一些无效技术使用或阻止不具成本-效益药物、器械或疗法的大范围应用提供了决策证据。

(10)新加坡:

为确保患者获得优质的持续性医疗服务,新加坡卫生部大力提倡卫生技术评估,在体系层面推动循证决策。1995年,建立了第一个卫生技术评估职能机构,2000年,建立“医疗服务发展项目”,负责管理新医药技术的准入,要求新技术的审核申请必须附该技术的卫生技术评估报告。目前新加坡政府将卫生技术评估广泛用于制定卫生政策,如制定标准化药品目录、决定医疗诊所证照颁发、完善医疗服务体系和建立医疗补偿制度等。

受政治体制、文化思想、经济社会发展水平等因素的影响,不同国家的医疗卫生体制不尽相同。目前全球近50个国家建立了卫生技术评估工作机制、规范的流程和相关研究机构,为这些国家的卫生决策提供了重要的证据支撑。很多国家从立法和政策高度规定了HTA在卫生政策制定中的作用,在中央或联邦层面建立具有独立法人资质的HTA研究机构。

无论是民营为主导的美国,还是以公立为主导的德国和法国,均以协商定价为调控医疗服务价格的主要手段。在市场定价基础上,以保险机构为主导,医务工作者和专业协会参与其中,共同合理定价。价格违法治理机制则以法律为核心,司法及专业部门根据法律予以相应裁决。

三、临床综合评价的流程及主题遴选

(一)药品临床综合评价评价的框架

药品临床综合评价是应用多种方法对多维度、多角度、多层次证据的综合过程,涉及多种方法,包括循证医学、流行病学、临床医学、临床药学、药物经济学、卫生技术评估等知识体系,将围绕安全性、有效性、经济性、创新性、可及性和适宜性等内容,进行定性及定量数据整合分析,形成综合判断依据。

在药品临床使用综合评价目的和原则指导下,在具体应用中的评价框架可包含7个部分(图1-1-5)。

图1-1-5 临床应用综合评价设计与流程

注:根据澳大利亚医院药品应用评价行业标准修订。

(二)主要评价设计流程及工作机制(图1-1-6)

图1-1-6 主要评价设计流程及工作流程(以基本药物目录遴选为例)

(三)评价主题遴选

以基本药物目录遴选为例:

1.遴选范围

围绕国家基本药物目录动态调整的需求,评价主题以基本药物和特殊人群用药为重点,兼顾已上市药物和新入市或拟入市药物,围绕其临床应用和政策管理问题形成评估主题,按照轻慢缓急的原则,有计划、分批次地开展评估。

2.遴选原则

围绕重要性、相关性和可评估性对主题综合判断进行优选。重要性指药品所涉及的疾病负担和用药需求大小、健康改善程度、对医疗费用和卫生服务体系影响程度;相关性是指与当前卫生决策需求的相关程度,与媒体舆论和社会公众关注度的符合程度。可评估性是指评估所需证据的可获得性和充分性,以及评估所需资源和时间的要求。

3.组织实施

卫生行政部门牵头定期开展主题遴选工作(如每年一次),由下设主题遴选专家委员会和遴选工作组实施具体工作。

主题遴选专家委员会。由卫生决策者代表、专家学者代表(包括临床医学、药学、卫生技术评估、流行病统计学、循证医学、卫生经济学和医学伦理等)、各级医务人员和患者代表组成。委员会人员总数为单数并控制在15名以内。专家委员会负责确定年度评估重点领域,对主题评分以及最终确定评估主题。

遴选工作组。可委托具有卫生技术评估能力的机构承担,根据遴选步骤,具体组织和实施遴选工作,以及沟通联系工作。

4.遴选步骤

参考国际卫生技术评估机构(包括英国NICE,加拿大CADTH和瑞典SUB等),主题遴选可分为6大步骤(图1-1-7)。

图1-1-7 综合评价主题遴选流程图

四、临床综合评价的实施与管理

下面的内容首先对评价的总体思路和流程进行概述,一般具体包括评价主题委托阶段、实施过程管理阶段、结果递交及验收撰写阶段3个阶段(评价质量控制贯穿整个评估过程)。

(一)评价工作的委托

包括撰写评价任务书的编制、组建评价工作小组以及制定评价实施方案。

1.撰写评价任务书

评价任务书是由评价发起方撰写的一个书面文件,其作用是为了说明评价发起方对准备启动的评价工作的具体要求。评价任务书内容主要包括拟评价工作的背景、目的、内容、对评价团队的要求、时间要求以及对评价报告的要求等。

2.组建评价工作小组

评价工作小组是指在评价工作中,接受评价发起方的领导,具体负责评价工作的组织。评价小组可以由评价发起方自己组建,也可以由受委托开展工作的第三方机构来组建。要对评价工作人员的培训、讲解评价实施方案和内容,调查、访谈、数据整理及分析等方面的要求。

3.制定评价实施方案

评价方案是实施评价的行动计划,是指引评价顺利实施的重要保障。一个较为完整的评价方案应当具备评价工作指引手册的功能,即明确评价的时间和阶段性工作任务,对每一阶段的工作进行细致分工,明确评价人员的职责,确定每项活动的产出,用一定的制度设计来保证评价的质量。

评价实施方案的内容包括9个方面,其中拟评价的主题的基本信息、评价流程及时间安排、评价方法和指标是方案中的核心内容(图1-1-8)。

图1-1-8 制定评价实施方案内容及要点

(二)评价实施过程管理

实施过程管理是指在将工作委托后,按照评价实施方案对药物实施综合评价的过程。从目前实践的情况看,评价的实施主要包括评价信息数据的收集、整理与分析、并根据数据的分析结果来判定评价结论。在实施过程中需要严格按照实施方案进行,并进行质量控制,以实时纠偏。

1.评价信息来源与数据收集

评价信息的类型和内容十分丰富,信息来源渠道和途径也非常广泛。在实际评价工作中,应该通过多种途径和方法收集信息。尽量消除信息失真而造成的评价误差。评价信息收集的方法通常包括案卷研究、资料收集与数据填报、实地调研、座谈会、问卷调查等。

2.评价信息及数据的处理

收集来的信息和数据需要经过处理或整理,将收集的信息和数据进行科学的分类和汇总,使其系统化、条理化、科学化,以反映所评价对象的特征和评价指标的要求。用于信息和数据处理的各类方法已发展完善和成熟,众多文献和专业教科书中都有讲解,在此只对处理步骤和方法进行简要说明。

首先,对于调查问卷回收的定量数据,需要建立数据库,将数据进行录入,同时对问卷填写数据进行审核,剔除无效和混杂数据,验证数据的质量和真实性。其次,对信息数据进行整理、序化。使其便于加工利用。最后,对信息数据进行加工,按照评价要求应用相应的统计学方法和模型进行综合分析,使其量化表达政策法规的评价效果。

采用科学的方法进行统计整理是顺利完成统计分析任务的前提。

(三)评价结果的递交与验收

评价结果报告递交包括3个主要步骤:起草评价报告初稿、与评价相关方(委托方、评价工作小组、有关专家等)沟通形成送审稿、经修改完善后形成报告终稿(图1-1-9)。

图1-1-9 评价结果报告递交与验收

五、药品临床综合评价的内容与方法

药品临床综合评价分3部分内容:药品技术评估、药品政策评价及药品综合价值判断。药品综合价值判断是基于药品技术评估和药品政策评价中产生的证据,按照多种价值维度进行综合判断,最终形成判断结果。

下面就3部分内容进行分别描述。

(一)药品技术评估内容与方法

药品技术评估包括6个方面内容:安全性评价、有效性评价、经济性评价、创新性评价、适宜性评价和可及性评价(图1-1-10)。

图1-1-10 药品技术评估内容与方法

1.安全性评价

报告药品上市前后药品安全性信息综合评价结果。纳入评价信息包括:①上市前药品安全性(药品说明书内容)及相对安全性(与同类产品比较)信息;②上市后药品安全性(不良事件及不良反应,用药差错及事故,各国药监部门发布的警告、撤市及说明书修改信息,厂家产品召回相关信息)及相对安全性(与同类产品比较)信息;③药品质量,药品稳定性,包括生物等效性等一致性评价结果。

2.有效性评价

利用可获得的数据(包括一手药品临床应用效果真实数据及二手文献数据等)和信息开展有效性评价,重点关注生存、复发、死亡等临床远期结局指标。从全国药物综合评价信息平台提取药品临床应用效果真实数据,结合二手数据及信息分析结果,进行效果综合评价。二手数据收集、整理及分析应包括建立检索策略、文献纳入、数据提取、质量评价、阐释结果等环节。

3.经济性评价

结合流行病学、决策学和生物统计学等多学科,比较分析不同药物治疗方案的成本、效果、效用、效益以及预算影响等,综合判断药物临床应用的经济学价值。

应综合考虑决策问题、关注的疾病及数据可获得性等因素,选择适宜的评价方法。常用的四种方法为成本-效果分析、成本-效用分析、成本-效益分析和最小成本分析。在条件允许的情况下优先考虑成本-效用分析。可基于原始数据,疾病自然史构建模型开展经济学评价。此外,也可根据需要开展基于二手经济学研究的系统评价。

经济学评价的关键要素应包括明确的决策问题、背景信息、评价角度、目标人群、干预与对照、评价类型、研究时限、成本和健康产出的测量、成本-效果/效用/效益分析、敏感度分析以及预算影响分析等。

评价的实施应参考现有的相关药物经济学评价指南,包括《中国药物经济学评价指南(2015版)》《中国药物综合评价参考大纲(第2版)》、国际药物经济学和结果研究协会(ISPOR)发表的系列指南。

4.创新性评价

综合药品研发生产及临床应用价值等信息,对药品创新性进行判断,主要依据如下:在治疗方案、适应证和治疗效果方面存在技术创新(如改善此领域技术短缺现状);在疾病或伤痛治疗方面有更高的安全性、有效性和实用性;对重大或紧急疫情具有突出贡献;药品纳入到专利范畴;具有商业转化潜质;能够带动健康产业发展等。

5.适宜性评价

药品适宜性评价包括如下维度:与疾病谱和居民用药需求相符的、与临床使用方式方法相切合的(剂型剂量、储存给药条件)、以及与当前我国医疗卫生服务体系相适应性的适宜性等。此外,还需从政府的视角研判药品进入市场后对公共资金的影响(可参考卫生技术评价预算影响分析相关内容)。

6.可及性评价

药品可及性评价主要涉及药品价格水平、可获得性和可负担性3个方面。药品价格水平通过将国内药品采购价格与最近一年的国际药品价格进行比较获得。药品可获得性通过医疗机构药品配备率等指标反映。可负担性通过药品单个疗程的治疗费与家庭灾难性支出比较获得。此外,根据评价需要可从不同渠道获得相关支持信息:如药品生产、供应相关信息,医疗机构药品使用数据;居民和患者代表意见等。应参考《WHO/HAI药物可及性标准化方法》开展药物可及性评价。

(二)药品政策综合评价内容与方法

国家药物政策是国家卫生医药政策的基本组成部分,是由政府制定用于指导药品研究、生产、流通、使用和价格等方面管理的重要文件。对药品政策予以评价以利于保障医药卫生体制改革顺利推进,提高政府民主、科学决策水平,化解政策风险,预防相关问题发生具有重要意义和价值。

1.国家药品政策评价主体

国家药品政策评价主体,即由谁来评价,指的是组织和具体承担评价工作的政策制定或实施机构。评价主体的任务包括:发起评价、组织实施评价、组织完成评价报告。通常可以分为内部评价和外部评价。内部评价是指政策制定或执行部门自主完成的评价。外部评价是指由制定和执行机构之外的评价者完成的评价,如委托科研机构、社会团体、咨询公司等开展的第三方评价。根据现实工作中需要,内部评价与外部评价可结合实施。内部评价和外部评价各有优缺点(图1-1-11)。

图1-1-11 内部评价和外部评价的优劣势比较

2.国家药品政策评价内容和方法

在政府主管部门的指导下,利用政府目前已有的药物集中采购平台数据、政策法规数据等资源,开展药物政策相关的评价工作。具体评价工作可参照WHO关于国家药物政策评估的相关内容,依据“结构-过程-结果”的理论框架,围绕药物政策的关键环节设计相应指标进行评价(图1-1-12)。具体包括:资源投入、组织保障、监督评价、药品遴选、生产流通招标采购、配备使用价格管理、支付报销、可获得性、可负担性和合理用药等。以及药品配备使用对行业、产业创新、医疗机构、医保、患者等利益相关者的影响。由于每一个基本药物的特点不同,在全面考虑各方面特征的基础上,每个基本药物政策评价的侧重点也应当不同。可就政策链条的关键环节综合评估,也可对其中一个或几个进行单项评估。评价内容和方法见表1-1-2。

图1-1-12 国家药品政策评价的“结构-过程-结果”的理论框架

表1-1-2 国家药品政策评价内容和方法

续表

(三)药品临床综合价值判断

药品综合价值判断是基于药品技术评估产生的多维度证据及从药品生产到使用各环节政策评价结果,综合、全面、系统、科学的判断药品的临床应用价值,以支持制定和完善药物政策。

由于不同利益相关者出于不同利益诉求,利益期许不同,因此在药品价值判断问题上,需要使用一套综合价值判断工具,将各方利益需求统筹考虑。

利益相关方诉求主要表现在以下几个方面(图1-1-13)。

图1-1-13 利益相关方的诉求

1.药物的综合价值评价国际案例摘录

本书摘录了国际组织如ISPOR、英国、澳大利亚、泰国等国家,从多维度、多视角对药物的综合价值进行判断的应用案例。

国际社会目前所采用的药物综合价值框架,核心理念均是“以患者为中心”。近年来,一些国际组织如国际药物经济学和结果研究协会(ISPOR)等,研究了患者为中心的价值框架体系(value framework),包括了两个方面的核心价值指标:一是成本,二是临床结果。在成本方面包括直接成本、间接成本、节约的成本以及净成本。临床结果则指健康的产出、治疗效果、与其他可能的治疗方法比较的效果、以及获得的质量调整生命年(QALY)。此外,还有其他一些要素,如①公平性(equity):不同群体、不同患者的药物可及性、药品费用的负担、获得基本药物、创新药物和罕见病药物的机会;②希望价值(value of hope):新技术疗效的不确定性,患者对新技术的意愿支付;③知识价值 (value of knowledge):提高精准医疗,降低治疗的不确定性;④保险价值(value of insurance):提供疾病和财务的风险保护;⑤科学溢价(scientific spillovers):新技术不仅能提高患者健康,而且促进科技的发展;⑥依从性(adherence):能直接影响到成本和疗效,与剂量和疗法有关,是口服还是注射,都与依从性有关,等等。

提供以价值为基础的医药卫生服务,决策者最大的挑战是如何优化医药卫生服务提供系统去改善患者的健康结果。在此方面,不论是税收制度模式、社会医疗保险模式还是自由市场体系的国家和地区,虽然基于各自医疗卫生制度有着不同的探索实践,但核心内容日渐趋于一致,基本理念是保证人人可公平获得优质、负担得起的药物。

英国:英国法律规定,国民健康服务体系(National Health Service,NHS)有义务为全体国民提供合理、充分且基于需求的护理服务。英国临床技术优化研究院(National Institute for Health and Clinical Excellence,NICE)负责对NHS在英格兰和威尔士地区所提供的药物和其他卫生技术作出必要性的推荐意见。2010年之前,NICE从卫生体系视角出发,主要应用的评判维度是临床有效性和成本-效果(常规药物增量成本阈值为2万~3万英镑/QALY);2010年之后,NICE将研判视角从卫生体系扩充至社会视角,价值维度也延展至12项(图1-1-14),主要包括核心价值维度6项,重点人群价值维度6项。其中6项核心价值维度也是NHS近年来实施的“基于价值的定价(valuebased Pricing)”的核心依据。

图1-1-14 英国NICE药物综合价值判断维度

澳大利亚:澳大利亚药品福利咨询委员会(Pharmaceutical Benefits Advisory Committee,PBAC)依 据《1953国 家 健 康 法National Health Act 1953》建立,主要职责是对药品是否纳入药品福利目录(Pharmaceutical Benefits Scheme,PBS)向卫生部作出建议,没有PBAC的推荐意见,任何药物不能纳入到PBS中。PBAC主要考量的价值维度是评估对象的成本-效果是否优于参比药品,主要由4个主要量化指标和7个次要量化指标构成(图1-1-15)。值得注意的是,这些指标均要求实现量化,并在相关说明中对数据来源和计算方法给出解释。

图1-1-15 澳大利亚PBAC药物综合价值判断维度

泰国:2007年,泰国成立了卫生干预和技术评估中心(Health Intervention and Technology Assessment Program,HITAP)是一个半自治的非营利性研究机构,主要职责为通过对包括药品、医疗器械、健康干预等卫生技术和项目进行评估,为国家相关政策制定,包括国家基本药物目录制定、全民健保福利包范围制定等,提供决策依据。HITAP在评估主题遴选环节和评审环节均设定了综合价值判断维度,主题遴选环节的价值维度主要包含6项,在完成评价工作进入评审环节,决策者主要依据2项核心价值维度进行决策(图1-1-16)。同时,所有的价值维度包含三个部分:定义、指标及分值设定,以保证所有的价值维度都能够实现指标化和量化,方便应用转化环节的操作实施。

图1-1-16 泰国HITAP药物综合价值判断维度

2.我国药品综合价值判断维度

我国药品价值维度选择须与自身国情密切相关,离不开我国的医药卫生体系和社会保障体系自有特点,且需要将“以人民为中心”的宏观卫生与健康价值观与“以患者为中心”的微观价值观相结合。在借鉴国际药品价值维度定义的基础上,本书提出的价值维度包括四部分,分别是临床价值、经济价值、社会价值和体系价值(图1-1-17):

图1-1-17 综合价值维度构成

临床价值:临床价值是价值维度设定的基础。这里的临床价值既包括药物上市前严格的临床试验效果,也包括药物上市后在真实世界真实人群的实际使用效果。着重评估该药品是否具备安全有效性,是否能更好地满足患者尚未满足的临床需求及降低疾病整体负担,是否具有临床创新性。

经济价值:经济价值是运用卫生经济学方法将临床价值予以量化。主要包括两个方面。①评估投入与临床疗效的价比,即成本-效果性价比,通过卫生经济学成本-效益经济模型综合评估该药品的性价比,包括成本测算的视角和范围,效果测量指标定义和应用、疾病状态转归、贴现率等;②通过基金冲击模型研究评估医保基金纳入该药品的承受或者支付能力,并参考国际卫生经济学研究结果进行结果验证,着重于从真实世界角度总体人群健康花费和健康收益的平衡。

社会价值:社会价值着重评估药品及其相关政策对社会带来的整体价值。包括该药品在改善患者临床症状以外能否进一步提高患者生命质量,尊重个体选择医疗卫生服务的权利,改善患者疾病转归路径,对社会带来的整体价值包括生产力的提升。其中的公平性维度包括机会和结果公平两层含义,机会公平的原则与卫生技术评估的成本-效果原则是兼容的,即卫生资源应该配置到健康产出较高的地方,而不应该受年龄、性别、收入、地位等因素的制约。此外,社会价值的视野还包括药品是否属于重大或紧急疫情用药、是否是特殊人群用药或孤儿药等涉及卫生伦理的问题。

体系价值:体系价值主要是从卫生体系管理者的视角研判药进入卫生体系后可预见与不可预见的管理成本和潜在问题。这一维度的主要内容与我国医药品监管体系相契合,具有“中国特色”。具体涵盖此药品是否获得入市审批并满足相关规定,是否与现行法律法规相冲突;所适宜配备的医疗机构及管理细则是什么;在使用和管理方面是否存在管理门槛和壁垒(例如应用环境、采购、配送、监管、报销等);是否符合单独核算、合理调控、优先使用、以量换价的管理条件等;是否可以通过药物的保障和医疗救助制度实行健康扶贫。

六、药品临床综合评价证据评审与结果转化应用

(一)药品临床综合评价的证据评审流程

证据评审是将综合评价结果进行多维统一的过程,从临床价值、经济价值、体系价值和社会价值等纬度判断药品的综合价值,并提出结果应用实施的意见,包括是否纳入基本药物目录、是否进入基本医保报销目录、是否推荐为重大新药创制项目、以及如何定价和支付等基本用药决策。

按照国家中心建立证据评审制度规范及相关工作要求,国家中心评审部组织专家委员会召开评审会,审阅临床证据评价结果和药品综合价值判断结果,并形成应用实施意见。

1.评审主体

受国家评估中心委托,专家委员会通过组织定期专题会议形式,遵循特定评审程序,对评估结果及推荐意见进行评审。

2.评审工作程序

评审工作程序分为3个阶段:①国家中心负责进行评审会前准备活动,并对专家委员进行评审前培训;②专家委员会召开首轮技术评审会,统一意见;③专家委员会召开二次评审会形成推荐意见(图1-1-18)。

图1-1-18 评审工作程序

3.评审结果的判断

评审结果的呈现遵循特定的表格格式,包括药品价值判断结果和推荐意见两部分。药品价值判断结果包括临床价值(安全性、有效性)、经济价值(成本、成本-效果、预算影响)、体系价值(创新性、适宜性)、社会价值(公平可及性)四个维度开展,高度凝练各纬度证据判断结果和评审会议专家意见,形成判断结果。

4.推荐意见的类别

结合特定药品评价问题,基于判断结果,选择不同推荐意见,包括①推荐(如进入基本药物目录、成为重大新药创制项目、纳入医保用药目录等);②有条件推荐(特定亚组人群,特定时间,特定计量和给药路径等);③综合评价专业分中心和区域分中心试点使用(为启动二次评价提供数据);④不推荐。

(二)证据评审结果转化与应用

很多国家都建立了药品评价结果转化机制,确保评价结果及时传播,充分转化为决策依据。我国当前建立的国家药品临床综合评价体系中,将结果转化与应用机制作为核心制度进行建设。

国家药具中心建立药品临床综合评价政策评审制度规范,组织专家委员会进行政策评审,根据药品综合价值判断结果,结合医药卫生改革与发展要求,形成有关证据及推荐意见应用实施要求。

药品临床综合评价将注重加强评价结果实施过程及应用评估,并建立评价结果应用关联机制。各级卫生健康行政部门运用药品临床综合评价结果,促进完善药品研发、生产、流通、使用等药物政策,健全药品供应保障制度。突出药品临床价值,推动有关证据用于国家基本药物、鼓励仿制药品、鼓励研发申报儿童药品的遴选和动态调整;指导医疗机构药品采购和上下级医疗机构用药衔接,优化医疗机构用药结构,提高安全用药、合理用药水平;提出药品价格政策和国家基本药物目录内药品生产鼓励扶持政策的建议;促进卫生资源配置效率提升,控制不合理药品费用支出;提出改进药品剂型、规格、包装合理化建议,引导企业研发生产适宜临床需求的药品。

本小结列举的我国临床案例包括:药品临床综合评价结果已支持药监部门药品撤市、新药准入、国产仿制药创制、基本医保药品目录调整等决策。

案例一:药物司莫司汀胶囊退市评估

2018年11月,国家药品监督管理局药品监督管理司发函《关于征求司莫司汀胶囊撤市意见的函》(药监药管函〔2018〕106号),征求国家卫生健康委药政司对于药品撤市的意见。为审慎决策,药政司委托我中心研究团队开展司莫司汀快速评估,综合分析药品技术特性、临床应用、安全性及有关监管支付政策,判断技术的撤市可行性,并针对药品进一步管理决策提出推荐意见。

鉴于决策类型及时间要求,评估定位为快速技术评估,从卫生体系角度围绕药品技术展开综合评估,重点判断技术安全性及临床应用风险,为撤市及后继决策提供证据。按照卫生技术评估(HTA)一般性评估框架,分析技术特性、临床应用、安全性及监管支付等技术管理政策。

选择性文献综述。制定检索策略及关键检索词,检索medline、CNKI等学术库有关中英文研究,收集技术特性、安全性及效果证据。共检索并阅读中文文献130篇,英文文献158篇。

各类网络信息检索。检索监管机构(美国药监局FDA,中国国家药监局NMPA,欧盟药监局EMA)、国家及各地医保部门网页、生产企业网站、原料药信息网页、医药数据库等,检索技术应用、监管及支付情况信息。

一对一专家访谈。选择有药品使用经验或开展有关药品研究的临床专家进行一对一访谈,了解技术应用情况及存在问题,咨询有关专家对于药品进一步管理的看法和建议。共访谈来自北京、天津、上海等大型公立医院药剂科和神经外科专家共6人。

评估发现,作为烷化剂亚硝脲类抗癌药物,司莫司汀被WHO明确列为Ⅰ类人类致癌物,具有高致癌性和骨髓抑制作用,未在国外正式上市。司莫司汀1996年在我国上市,主要作为脑胶质瘤的二线治疗药品,目前使用比例较低,存在安全性和效果更优的同类可替代药物。

基于评估发现,研究者提出结论:司莫司汀临床应用风险大、安全性低,在脑胶质瘤等适应证治疗方面可被其他药物替代,已不适合我国临床继续使用,支持国家药品监督管理部门作出的撤市决定,同时建议该药退出国家基本药物目录,退出国家及地方基本医保用药目录。

有关建议由国家卫生健康委药政司审议后递交给国家药品监督管理局,供其决策使用。

案例二:丙肝药品经济学评价

2015年9月—2016年3月,国家卫生健康委卫生发展研究中心接受WHO驻华代表处委托,利用卫生技术评估方法,开展了丙肝标准药物治疗方案的经济学评估,通过结合二手文献数据及我国临床真实世界流行病、诊疗流程及费用数据,在建立统一评估方案和指标基础上开发经济学分析模型,模拟分析了我国引入直接抗病毒药物对于公共财政、基本医保和患者个人的经济影响,为药品引进、定价和支付等政策制定储备了证据,有关评价过程和方法被WHO作为案例向其他国家进行推广介绍。评价执行过程中,研究团队利用WHO提供的专家资源,集合了国内临床医生、临床药师、疾病防控、循证医学、经济学家、卫生政策分析人员等有效利用各种技术能力,利用咨询和参与组织机制确保了评价的科学性、客观性、透明性。

2017年11月—2018年5月,在前期丙肝药物经济学评估基础上,卫生发展研究中心受国家卫生健康委药政司委托,开展了完整的直接抗病毒药物(DAA)在我国临床治疗丙肝的经济学评价,与我国临床现有诊治技术做了比较成本-效果分析,结合预算影响分析结果,提出了具体的政策建议。丙肝评估结果有力地支持了丙肝药品仿制药创制科技重大项目立项、丙肝药品定价和采购决策等。

案例三:药物波生坦快速评估

2018年12月,国家医疗保障局医药服务管理司发函,征求国家卫生健康委药政司关于2018年版基本药物目录中非医保品种评审意见。为审慎决策,国家卫生健康委药政司委托国家卫生健康委发展研究中心研究团队开展波生坦快速评估,综合分析药品技术特性、临床应用、安全性、有效性、经济性及有关监管支付政策,判断技术纳入医保的可能性,并针对药品进一步管理决策提出推荐意见。

鉴于决策类型及时间要求,本评估定位为快速药品评估,从卫生体系角度围绕药品技术展开综合评估,重点判断药品的安全性、有效性和经济性,为是否纳入国家医保目录决策提供证据。按照卫生技术评估(HTA)一般性评估框架,分析技术特性、临床应用、安全性、有效性及监管支付等技术管理政策。主要采用基于文献资料研究及患者、专家访谈的方法对药品进行评估。

文献检索。制定检索策略及关键检索词(中文“波生坦”,英文Bosentan),检索Cochrane,Embase,CNKI等学术库有关中英文研究,收集技术特性、安全性、效果证据及成本-效果证据。共检索并阅读中文文献52篇,英文文献73篇,最终纳入评估18篇。

网络信息检索。检索监管机构(美国药监局FDA,中国国家药监局NMPA,欧盟药监局EMA)、国家及各地医保部门网页、医药数据库等,检索技术应用、监管及支付情况信息。

关键知情人访谈。对心血管专家就波生坦临床应用情况进行访谈。针对7名肺动脉高压患者就平日用药、月均花费等事宜进行访谈。

评估发现,波生坦是针对肺动脉高压类罕见病的主要治疗药物之一,具有明确的临床效果,但因肝毒性较强存在安全性问题。相比安立生坦等同类药物,波生坦成本-效果不佳。随着仿制药及新一代肺动脉高压药品上市,波生坦的临床效果和成本-效果将持续处于劣势,其临床应用可能会受到限制。

基于上述发现,研究团队提出建议,波生坦纳入医保的证据不充分,建议充分评估波生坦及同类药物的安全性、有效性和经济性后作出医保准入决策。鉴于肺动脉高压患者面临较重的经济负担,建议国家医保局优先考虑有关患者用药保障问题,在综合评估基础上选择适宜药物纳入医保基本用药目录。

有关建议由国家卫生健康委药政司审议后递交给国家医保局,供其决策使用。

案例四:药物1,6-二磷酸果糖合理应用评价

1,6-二磷酸果糖是《国家基本药物制剂品种目录》(2002版)药品,主要用于新生儿缺血缺氧性脑病。该药2004年是北京市医保用药金额第一的药品,引起了当地医保管理部门的重视,委托北京大学第三医院药剂科开展了系统评价,结果显示该药缺乏有效性证据。基于评价结果,《国家基本药物目录》将该药调出,同时国家基本医保用药目录将药品的应用范围调整为“限急救”使用,最终研究结果使药品市场份额大幅度缩小,国家医保节省了数十亿元的药品资金支出。

七、开展药品临床综合评价的保障措施

(一)加强组织领导

开展药品临床综合评价是一项创新性、系统性工作。各地卫生健康行政部门要充分利用和拓展现有设施资源,细化政策措施,争取多方支持,完善工作机制,加强人员培训,有序规范推进。建立健全管理制度,做好风险防控,对于临床综合评价结果的公开发布要稳妥审慎。卫生健康行政部门根据需要组织开展的临床综合评价,承担和参与评价工作的机构和单位未经授权和允许不得对外发布和泄露相关信息。

(二)强化责任落实

各级卫生健康行政部门要明确任务分工,相关机构和单位要在落细落小落实上下功夫。国家卫生健康委药具管理中心承担药品临床综合评价具体事务性工作,提出评价工作建议。国家卫生健康委卫生发展研究中心承担牵头组织制订药品临床综合评价管理指南和相关技术规范,提供技术指导咨询;指南和技术规范的制订要充分发挥相关医疗机构、科研院所和行业学协会等专业学术团体作用。国家心血管病中心、国家癌症中心等国家级机构要充分发挥带头示范作用,承担药品临床综合评价相关专项指南的制订,积极主动汇集临床证据、开展相关评价并推动评价结果的应用等。

(三)保障数据安全

各地要按照“谁主管、谁负责,谁授权、谁负责,谁使用、谁负责”的原则,加强药品使用监测和临床综合评价过程中的数据采集、存储、挖掘、应用、运营、传输等环节的安全和管理。各责任单位要建立健全相关安全管理制度、操作规程和技术规范,落实“一把手”责任制,严格执行国家有关保密规定,按照国家网络安全等级保护制度要求,构建可信的网络安全环境,提升关键信息基础设施和重要信息系统的安全防护能力,保障数据安全。任何单位和个人不得使用非法手段获取数据,不得擅自利用和发布未经授权或超出授权范围的数据。

(赵 琨 肖 月 赵 锐 郭武栋 刘跃华 隋宾艳 邱英鹏)

第二节 抗肿瘤药物临床综合评价指南

一、抗肿瘤药物临床综合评价概述

(一)抗肿瘤药物临床综合评价指南制定背景

目前恶性肿瘤已成为严重威胁我国居民健康的重大疾病,且发病率和死亡率逐年上升。根据2015年国家癌症中心数据显示,我国目前每年癌症新发病例约392.9万人,死亡约233.8万人。平均每天超过1万人被确诊为癌症,每分钟约有7.5个人被确诊为癌症。与历史数据相比,癌症疾病负担呈持续上升态势。近10多年来,恶性肿瘤发病率每年保持约3.9%的增幅,死亡率每年保持2.5%的增幅。每年恶性肿瘤所致的医疗花费超过2 200亿元,防控形势严峻。《2018年中国卫生健康统计年鉴》显示,城市居民恶性肿瘤死亡率为160.72/10万,占城市居民总死亡人数的26.11%,位居死亡疾病首位;农村居民恶性肿瘤死亡率为156.7/10万,占农村居民总死亡人数的23.07%,位居死亡疾病第二位,仅次于脑血管疾病。恶性肿瘤患者平均住院日为12.6天,人均医药费用为19 043.77元。可见,恶性肿瘤已给社会和家庭造成沉重的疾病负担。

对恶性肿瘤的主要治疗手段包括外科手术、化学治疗、放射治疗、生物免疫治疗、分子靶向治疗、激素治疗和干细胞治疗等。

抗肿瘤药物是指可抑制肿瘤细胞增长,对抗和治疗恶性肿瘤的药物,传统上抗肿瘤药物依据其性质及来源分为6类,即烷化剂、抗代谢药、抗肿瘤抗生素、抗肿瘤植物成分药、其他抗肿瘤药、抗肿瘤激素类。只有经组织或细胞学病理确诊、或特殊分子病理诊断成立的恶性肿瘤,才有指征使用抗肿瘤药物。抗肿瘤药物的药品说明书是抗肿瘤药物临床应用的法定依据,其规定的适应证经过了国家药品监督管理部门批准。抗肿瘤药物临床应用须遵循药品说明书,不能随意超适应证使用。特殊情况下抗肿瘤药物使用采纳根据,依次是:其他国家或地区药品说明书中已注明的用法,国际权威学协会或组织发布的诊疗规范、指南,国家级学协会发布的经国家卫生健康委员会认可的诊疗规范、指南。

抗肿瘤药物购用品种遴选应当以确保临床合理需要为目标,优先选择《国家基本药物目录》、国家谈判品种、高级别循证医学证据多以及权威指南推荐的品种。在抗肿瘤药物临床应用中,应考虑药物的效价比,优先选择有药物经济学评价优势和效价比高的药品。

抗肿瘤药物临床应用管理的宗旨,是通过科学化、规范化、常态化的管理,促进抗肿瘤药物合理使用,达到安全、有效、经济地治疗肿瘤的目的。抗肿瘤药物临床应用的分级管理是抗肿瘤药物管理的核心策略,有助于减少抗肿瘤药物过度使用或使用不足。根据药物适应证、药物可及性及肿瘤治疗价值,将抗肿瘤药物分为两级:第一,“普通使用级”:有明确的临床适应证,已列入《国家基本药品目录》,《国家基本医疗保险药品目录》和国家谈判药品的抗肿瘤药物品种。《国家基本药物目录(2018年版)》中将抗肿瘤药物分为烷化剂、抗代谢药、抗肿瘤抗生素、抗肿瘤植物成分药、其他抗肿瘤药、抗肿瘤激素类、抗肿瘤辅助药和抗肿瘤靶向药8种。第二,“限制使用级”:有明确的使用适应证,未列入《国家基本药品目录》《国家基本医疗保险药品目录》或国家谈判药品的抗肿瘤药物品种。特殊情况下抗肿瘤药物的使用应当仅限于三级医院授权的具有高级专业技术职称的医师,充分遵循患者知情同意原则,并且应当做好用药监测和跟踪观察。

随着肿瘤生物学研究的不断进展和对恶性肿瘤疾病认识的不断深入,新的作用机制、作用靶点的抗肿瘤药物不断涌现,抗肿瘤药物的针对性越来越强。细胞分化诱导剂、细胞凋亡诱导剂、生物反应调节药、具有靶向性的表皮生长因子受体阻断剂、单克隆抗体等不断上市或进入临床试验。

但目前上市的抗肿瘤药物尚不能完全满足肿瘤患者的用药需求,药品说明书往往滞后于临床实践,一些具有高级别循证医学证据的用法未能及时在药品说明书中明确规定。

此外,抗肿瘤药物毒副作用大、药品价格相对较高,且新上市药物普遍缺少中国人群临床试验数据,如何评价这些抗肿瘤药物在临床治疗实践中的综合效果,是亟待解决的药品评价问题。为此,国家卫生健康委提出制定《抗肿瘤药物临床综合评价指南》,从安全性、有效性、经济性、创新性、适宜性和可及性的维度,对真实世界的数据进行定性及定量分析,形成抗肿瘤药物的综合评价结论,为拟定国家抗肿瘤药物政策、优化国家基本药物目录、抗肿瘤药物临床规范使用、确定抗肿瘤药物重点创新研发方向和保障特殊人群用药等提供科学的循证决策。

(二)抗肿瘤药物临床综合评价指南制定目的

为逐步推进药品临床综合评价工作的深入实施,国家卫生健康委拟以《国家基本药物目录(2018年版)》中疾病负担重、严重程度高、社会关注度大、涉及重点人群的药品为优先评价对象,依托国家和地方科研机构、医疗机构和第三方评价机构等开展药品临床综合评价。为了实现上述工作目标,需要从技术层面制定规范化、标准化、科学化的疾病别药物评价指南,以便实现评价工作的统一性和可操作性。

本指南以抗肿瘤药物实际临床疗效为抓手,以药品治疗疾病的本质属性为依归,以基本药物和特殊人群用药为重点,以药品临床实际价值为导向,参考国内外药品评价方法,制定符合我国国情的抗肿瘤药物临床综合评价指南,规范评价组织机制、评价流程、评价方法和数据体系,科学、准确、客观地指导抗肿瘤药物临床综合评价的实施,全面助力完善医药治理体系、优化医药卫生资源配置和提升药品供应保障能力,精准、高效、高质量地服务人民。

评价者在面对某抗肿瘤药物时,应在充分了解被评价药物安全性和有效性的基础上,综合考虑经济性、创新性、适宜性及可及性,依据本指南组织实施评价工作。本指南将根据学科发展不断更新和完善。

(三)抗肿瘤药物临床综合评价指南制定原则

为保证评价过程公平、公正、透明,评价结果科学、准确、客观地展现抗肿瘤药物的安全性、有效性、经济性、创新性、适宜性和可及性,指南制定遵循以下原则:

1.在确保科学性的前提下,并重评价指南的可及性和实用性。本指南适用于科研机构、医疗机构或第三方评价机构,考虑到不同机构评价人员的专业知识水平存在不均衡性,在确保科学性的前提下,选择成熟、适宜的评价方法,以保证评价指南的可及性和实用性。评价过程全程监督、记录、可追溯,保证评价过程公平、公正、透明。

2.针对抗肿瘤药物的特殊性,确定重点评价指标。由于恶性肿瘤疾病的特殊性,抗肿瘤药物在安全性、有效性、经济性、创新性、适宜性和可及性评价方面皆有别于其他药物,例如药品不良反应发生率高、各类肿瘤疾病治疗结局指标较为一致等。为此,本指南针对抗肿瘤药物的特殊性,确定了抗肿瘤药物重点评价指标。

(四)组织架构与职责划分

所有评价工作开始之前均应成立相应的抗肿瘤药物临床综合评价项目组,项目组下设置2个组,包括评价专家指导组和评价工作组(图1-1-19)。抗肿瘤药物临床综合评价项目组的成立是顺利完成评价并获得准确评价结果的核心和关键。建议由各试点省市卫生健康行政部门统筹建立本行政区域内的抗肿瘤药物临床综合评价专家指导组,并根据评价任务实际需求建立若干个抗肿瘤药物临床综合评价工作组。

图1-1-19 抗肿瘤药物临床综合评价组织架构图

1.评价专家指导组

评价专家指导组由评价项目所涉及相关领域的临床专家、药学专家、卫生政策专家、卫生技术评估专家、药物经济学专家和统计学专家等组成,成员均应具有高级专业技术职称。成员人数为9~15人之间,宜为单数。评价专家指导组选举1名组长负责统筹安排评价专家指导组的具体工作。此外,为使评价更加合理,可酌情将企业代表、患者代表及群众代表纳入评价专家指导组,广泛听取多方意见。

评价专家指导组的职责范围是负责组建评价工作组、确定评价主题、审阅评价计划、监督评价过程并核准评价结果。

2.评价工作组

评价工作组由评价专家指导组根据评价涉及具体问题的需要进行组建,其成员构成应具有代表性,能够保证所需各个学科、专业领域的平衡,并确保其具备评价项目相关的专业知识和方法学技能,且与评价项目没有利益冲突,以保证评价结果的可靠性。成员人数为10~20人,主要包括临床药师(5~8人)、医院网络信息技术人员(1~3人)、卫生经济技术人员(1~3人)、公共卫生管理技术人员(1~2人)、统计学技术人员(1~2人)、临床医生(1~2人)等。评价专家指导组指定1名组长负责统筹安排评价工作组的具体工作。

评价工作组的职责范围是依据评价主题,明确评价问题,制定评价计划(附录一),实施评价,并形成评价结果报告。

二、抗肿瘤药物临床综合评价维度

抗肿瘤药物临床综合评价需要重点关注药物的安全性、有效性和经济性,同时结合实际需求综合选择创新性、适宜性和可及性的评价指标。各维度所涉及评价指标选择应以患者为中心,量化患者应用药物实际获益及相关风险。指标选择应保证科学性、客观性、准确性和时效性。

(一)有效性

抗肿瘤药物评价的有效性指标主要以患者用药后的实际疗效为依据,设立主要临床结局和次要临床结局指标。优先选取能够反映患者长期获益及用药后整个生命进程、疾病转归等相关指标为主要临床结局,其他可准确测量的临床指标等作为次要临床结局。

1.主要临床结局

主要临床结局包含总生存期与无进展生存期两个指标。

(1)总生存期(OS):

从界定的开始时间(如随机分组)至因各种原因导致患者死亡的时间。

(2)无进展生存期(PFS):

从界定的开始时间(如随机分组)至出现肿瘤客观进展或死亡的时间。

2.次要临床结局

次要临床结局指标主要包括至疾病进展时间、无病生存期、无远处转移生存期和客观缓解率。

(1)至疾病进展时间(TTP):

从界定的开始时间(如随机分组)至出现肿瘤客观进展的时间,不包括死亡。

(2)无病生存期(DFS):

从界定的开始时间(如随机分组)至出现肿瘤复发或由任何原因引起死亡的时间。

(3)无远处转移生存期(DDFS):

经过治疗后除原发病灶以外,未发现全身其他地方有转移病灶的时间。

(4)客观缓解率(ORR):

肿瘤体积缩小达到预先规定值并能维持最低时限要求的患者比例。对肿瘤负荷进行评估是判断肿瘤治疗效果的重要手段之一,瘤体皱缩(目标疗效)和病情恶化在临床试验中都是有意义的判断终点,评价标准可依据实体瘤疗效评价标准指南(Response Evaluation Criteria in Solid Tumors,RECIST)(附录二)。

RECIST标准在近10余年应用过程中几经更新,已成为国内外肿瘤界采用的通用标准。然而,随着介入治疗、靶向治疗以及免疫治疗药物越来越多地应用于临床,传统实体瘤放射、化学治疗的效果评价标准并不能准确而全面地评价介入、靶向及免疫治疗药物的抗肿瘤效果。因此,近年来陆续涌现出一些新的评价标准,将肿瘤的大小和密度结合起来考虑,从而排除坏死肿瘤组织的干扰,如基于RECIST衍生的其他相关标准(mRECIST、iRECIST)、胃肠道间质瘤的CT疗效评价改良标准(Choi标准)和免疫相关评价标准(immune-related response criteria,irRC)等。以上标准各有利弊,在抗肿瘤药物临床综合评价中,应结合被评价药物的实际应用特点,酌情选择评价标准。

所有纳入研究的患者,即便存在违背主要治疗方案和不合条件出组的情况,都应进行疗效评价。每一个患者均可归入以下分类中的一类:①完全缓解;②部分缓解;③疾病稳定;④疾病进展;⑤因肿瘤致早期死亡;⑥因治疗毒性致早期死亡;⑦其他原因致早期死亡;⑧无法分类(不能评价或资料不完整)。所有符合入组标准的患者都应包括在有效率的分析中,归入4~8类的患者视为治疗无效。因此,不正确的治疗计划和给药途径不会导致患者被排斥在有效率的分析之外。4~8类的精确定义因研究方案而异。所有的结论都应该建立在合格患者的基础上。具体结果判定可参考表1-1-3。

排除那些违背主要治疗方案的患者(如其他原因致早期死亡、早期中断治疗、未完成主要治疗等),可以对亚组患者进行分析。但是不能从亚组分析中得出治疗效果的总体结论,而且必须明确报告排除患者原因,并按要求提供95%的可信区间范围。

表1-1-3 总疗效评价

血液肿瘤主要包括白血病、淋巴瘤和骨髓瘤三大类。因淋巴瘤具有可测量病灶,其客观缓解率的评定可参照实体瘤评价标准。而白血病和骨髓瘤可分多种临床类型,不同类型的疗效评价标准也不完全相同,具体评价时可参考相关病种指南或诊疗规范,如美国国立综合癌症网络(National Comprehensive Cancer Network,NCCN)指南,《成人急性淋巴细胞白血病诊疗规范(2018年版)》《成人急性髓系白血病诊疗规范(2018年版)》《成人慢性粒细胞白血病诊疗规范(2018年版)》等。

(二)安全性

抗肿瘤药物评价的安全性主要考虑患者用药后引起的药品不良事件,评价指标可选药品不良事件发生率,主要依据常见不良反应事件评价标准(Common Terminology Criteria for Adverse Events,CTCAE)(附录三),CTCAE将药品不良事件按不同系统,不同级别分为五级,安全性评价需考虑总体不良事件发生率和三级以上不良事件发生率两类指标。

(三)经济性

经济性维度主要用于评价资源消耗与临床疗效的性价比。可通过费用比较分析与模型分析法综合评估药品间的资源消耗和健康产出比值,进而形成优选方案。资源消耗可通过费用指标数据与成本指标数据进行衡量;健康产出可以通过效果指标数据和效用指标数据进行衡量;最终通过统筹考虑增量成本-效果比与预算影响分析进行经济性研判。相关具体概念介绍如下:

1.费用指标

主要包括挂号费、药费、手术费、诊疗费、治疗费、护理费、监护费、材料费、病房费、检验费及其他直接医疗费用,数据主要来源于医疗机构信息系统(hospital information system,HIS),包括患者费用信息,病案首页信息及患者日清单信息等。费用数据因其较易获得,与诊疗实际相映射,视需要可直接开展费用比较分析。在某些情况下,亦可辅助开展模型分析。

2.成本指标

主要包括直接成本、间接成本和隐性成本,其中直接成本包括直接医疗成本和直接非医疗成本。成本范围的界定需要与所确定的研究角度和研究时间保持一致。常用的研究角度有:全社会角度、卫生体系角度、医疗保障支付方角度、医疗机构角度和患者角度。

全社会角度下应纳入所有直接医疗成本、直接非医疗成本和间接成本,所有应用于公共决策的经济学评价都应该提供全社会视角的研究结果;卫生体系角度下应纳入卫生系统内的所有直接医疗成本;医疗保障支付方角度下应纳入医保支付范围内的所有直接医疗成本;医疗机构角度下,应纳入在本医疗机构承担的直接医疗成本和非医疗成本(如果适用);患者角度下,应纳入患者相关的所有直接医疗成本、直接非医疗成本和间接成本。

直接医疗成本是指患者因寻求医疗服务而直接消耗的医疗资源,如挂号费、药费、手术费、诊疗费、治疗费、护理费、监护费、材料费、病房费、检验费、检查费用等。

直接非医疗成本是指患者因寻求医疗服务而直接消耗的医疗资源以外的资源,如交通费、食宿费、营养食品费等。一般情况下,直接非医疗成本因条件差异大,难以准确计算。因此如果所占比例较小,在研究中可将其忽略。

间接成本是指由于疾病、伤残或死亡造成的患者和其家庭的劳动时间及生产率损失,包括休学、休工、早亡等造成的患者及家人的工资损失等。这一部分数据较难收集,不同人群生产力的损失也较难统一标准,目前研究较少。

隐性成本是指因疾病或实施预防、诊断等医疗服务所引起的疼痛、忧虑、紧张等生理上和精神上的痛苦及不适。很多癌症晚期患者遭遇疼痛的折磨,有很高的隐性成本,但由于难于测量,很少包括在内,一般体现在患者的效用中。

推荐采用卫生体系角度对抗肿瘤药物进行成本分析。抗肿瘤药物一般价格昂贵,是构成直接医疗成本的主要内容,应准确收集药品价格(考虑患者援助计划)、剂量、疗程、使用时间等数据对药品费用进行测算。此外,抗肿瘤药物一般不良事件较多且涉及范围广,应关注三级以上不良事件产生的治疗费用,将其干预和监测成本纳入直接医疗成本。报告结果时建议在不同药品价格水平和不同情境下做治疗成本的情境分析,供决策者参考。可采用国际上比较通用的生产要素法以及作业成本法(activity-based costing,ABC)进行成本分析。

3.效果指标

效果指标指抗肿瘤药物在真实临床应用环境中的实际效果,包括延长生命年(life years gained,LYG)、主要临床结局指标,例如总生存期(OS)、无进展生存期(PFS),次要临床结局指标,例如至疾病进展时间(TTP)、客观缓解率(ORR)等。效果指标还可以是HIS信息系统可以获得的住院天数、住院死亡率、重复入院率等。指标的采集可通过一手资料法从医疗机构临床实践数据中获取(例如:HIS信息系统与患者随访数据),或来源于文献资料。

4.效用指标

在无法开展药品等效评价的情况下,推荐使用质量调整生命年(quality-adjusted life years,QALYs)作为效用指标开展评价。QALYs的计算为延长的生命年数乘以这段时间内的健康效用值(权重值),既考虑了治疗方案对患者生存时间的影响,也考虑了对患者生命质量的影响。

效用值可用通用量表或疾病专用量表间接测量获得,常用通用量表有欧洲五维健康量表(euroqol five dimensions questionnaries,EQ-5D)等;肿瘤常用疾病专用量表主要由系列生活质量量表(quality of life core questionnaire,QLQ)组成。该量表由欧洲癌症治疗研究组于1993年研制,主要用于癌症患者生活质量的评定,此调查表目前在国际上应用广泛。QLQ为系列量表,由针对所有癌症患者的核心量表(共性模块)QLQ-C30 和针对不同癌症的特异性条目(特异模块)构成的量表群组成。目前已开发出肺癌(QLQ-CL31)、乳腺癌(QLQ-B2R3)、头颈癌(QLQ-HN35)、直肠癌(QLQ-C38)等多个特异性模块。

5.增量成本-效果比(incremental cost-effectiveness ratio, ICER)

增量成本-效果比是指评价药品与对照药品的相对成本和效果之差的比值。综合考虑效果与成本两个维度,如果ICER小于阈值,则评价药品成本-效果高于对照药品,反之亦然。然而,目前我国还没有关于ICER阈值的统一标准,各国也没有统一的共识。不同疾病或健康状态下的阈值可能存在特异性。

以英国为例,一般药物(如慢性疾病药物)评价的ICER值为2万~3万英镑/QALY;而治疗生命终末期患者的药物(如抗肿瘤药物),ICER值高于一般药物。例如,如果该药物用于治疗少数患者群体,英国国民医疗保健计划(NHS)中不存在具有相当健康收益的替代治疗方案,现有药物治疗某种癌症的预期生存时间小于2年,某种新药较原有治疗能额外延长患者3个月以上的生存期,英国国家卫生与临床优化研究所(National Institute for Health and Care Excellence,NICE)将治疗生命终末期患者药物的阈值从2万~3万英镑/QALY提高至5万英镑/QALY。

为了验证研究结果的稳定性,建议对ICER结果开展敏感性分析,以便应对方法学及模型不确定性和参数不确定性。以上分析均可通过模型分析法实现,具体参见本指南第三章模型分析法。

6.预算影响分析(budget impact analysis, BIA)

预算影响分析旨在测算纳入新的抗肿瘤药物后,对医疗系统费用支出产生的影响,反映未来3~5年,在纳入新的抗肿瘤药物后每年医疗系统医疗费用的变化。

如果药物经济学评价发现新抗肿瘤药物具有经济性,同时预算影响分析认为预算资金对新抗肿瘤药物可负担,则决策者应考虑新抗肿瘤药物纳入报销范围;如果药物经济学评价发现新抗肿瘤药物具有经济性,但预算影响分析认为其不可负担,则决策者需要对纳入报销的方式进行讨论。例如采用价格谈判或“量价挂钩”的方式要求供应商降价,或是通过风险共担协议来保证资金预算安全。

(四)创新性

抗肿瘤药物的创新性评价是一个专业性强、多角度、多层级的信息收集和研判的过程,不同的评价角度和侧重点会有不同的结论。抗肿瘤药物的创新参与主体涉及政府、药商、经营企业、医生和患者,且对创新的理解和诉求各不相同。本着以患者为中心的原则,本指南从患者角度考虑药品的创新价值。综合国内外文献结果和我国现实情况,创新性评价指标设置为两个:①满足临床尚未满足的诊疗需求:指填补现有抗肿瘤药物在治愈或改善目标疾病症状有显著效果,重点考虑对目标疾病的精准治疗,以及针对新的适应证有创新治疗效果等。②用药创新:主要依据包括在疾病或伤痛治疗方面有更高的安全性、有效性和实用性;在治疗方案、适用人群、给药间隔、给药周期、药品剂型、给药途径、拆分包装和药品储存条件方面存在技术创新(如改善此领域技术短缺现状)等。

上述两个指标的评价主要通过文献综述法和专家访谈法实现,由专家根据文献信息和专业经验,从上述两个创新性指标对所评估药物创新性程度得出差异性意见。例如:将创新性推荐等级分为三类,分别为强烈推荐、一般推荐和不推荐。此外,抗肿瘤药物的创新性评价亦可参照《化学药品注册分类改革工作方案》中对创新药的定义。创新性指标的测量可以通过专家问卷的形式实现量化,具体问卷设计、调查流程、计算方法可参见《问卷设计手册:市场研究、民意调查、社会调查、健康调查指南》。

(五)适宜性

因抗肿瘤药物治疗疗程一般较长,药物适宜性对于提高患者的长期用药依从性具有重要作用。适宜性评价主要从药品本身的剂型、服用方法、储存条件等方面进行评估,具体评价可参照《中国药品综合评价指南参考大纲》(附录四)。以上适宜性指标与创新性、可及性指标方面存在重合情况,在进行适宜性评价时可结合被评价药物的实际情况重点关注对患者用药依从性影响较大的指标,如剂型适宜性、剂量单位适宜性、包装适宜性、疗程适宜性、价格适宜性、配制和给药难易程度等。

适宜性信息主要通过文献信息收集和问卷调查实现。资料来源主要包括:药品相关政府网站信息,如:国家药品监督管理局(NMPA)网站、美国食品药品监督管理局(FDA)网站等;药品相关材料,如:药品说明书、药品注册资料、媒体广告、市场调查资料(供应情况)等;文献数据库,如:中国医院知识资源总库(CHKD)和企业申报资料等。也可通过医务人员调查问卷(内容包括药物的起效快慢、药品使用方法的难易)收集信息。适宜性指标的测量可以通过专家问卷的形式实现量化,具体问卷设计、调查流程、计算方法可参见《问卷设计手册:市场研究、民意调查、社会调查、健康调查指南》。

(六)可及性

可及性是各国推行基本药物制度必须实现的一项重要目标。为此,2003年WHO和国际健康行动机构(Health Action International,HAI)的专家学者提出了评估基本药物可及性的标准调查法(the WHO/HAI standardized approach)。基于WHO/HAI标准调查法制定原则,抗肿瘤药物可及性评价主要涉及药品价格水平、可获得性和可负担性三个方面。

1.药品价格水平

可通过国家或省级药品集中采购平台或其他来源,获得药品采购价格,计算中位价格,或与最近一年的国际药价指南的价格进行比较,计算中位价格比(median price ratio,MPR)。比较国际药价时需采用购买力平价指数进行货币换算,一般认为MPR≤4时药价基本合理。

2.可获得性

抗肿瘤药物可获得性通过医疗机构药品配备率等指标反映。药品配备率RM=配备该药品的机构数/调查机构总数×100%,通过抽样调查获得。一般认为配备率<50%为可获得性较低,50%~80%为可获得性较好,>80%为可获得性好。

3.可负担性

我国城乡居民生活水平差异明显,可分别针对城镇和农村居民进行疾病可负担性评价。依据我国城乡居民的平均收入数据,按药品的灾难性支出影响和致贫作用等方法进行可负担性评价。可负担性是指通过药品单个疗程的治疗费与家庭灾难性支出比较获得。灾难性支出评价基于某疾病日治疗费用占居民日均支出的比例评价。当药品支出超过家庭总支出的一定百分比时,就可将其视为“灾难性支出”或“不可负担”。家庭药品现金支出是指家庭成员以现金方式直接支付的药品费用,但应扣除由各种医疗保障所支付的补偿金。分母为家庭总支出,通常支出超过家庭总支出的10%就视为“灾难性”的,此时家庭可能被迫牺牲其他的基本需求、出卖资产、产生债务等。可参考《WHO/HAI药物可及性标准化方法》开展药物可及性评价。

抗肿瘤药物价格水平、可获得性和可负担性指标可以通过文献综述法实现,如文献不充分,可另行采用真实世界数据和专家访谈法作为替代和补充。

三、抗肿瘤药物临床综合评价关键环节

评价流程主要涉及明确研究问题、研究设计、评价方法、数据收集4个关键环节,主要回答药品临床综合评价工作“怎么做”的问题。为了满足评价实践需求,本章节依次就如何明确评价问题、如何设计评价框架、如何应用研究方法及如何开展数据收集进行详细阐述,以便指导评价者开展评价工作。

为保证评价的科学性和准确性,评价的过程应严格按照抗肿瘤药物临床综合评价流程进行,具体流程见图1-1-20。

图1-1-20 抗肿瘤药物临床综合评价流程图

(一)评价问题

评价工作组制订评价计划之前,必须围绕评价主题形成具体的评价问题,这将有助于完善研究设计、形成数据收集方案并确定评价方法。评价主题的遴选遵循国家建立的主题遴选机制,以基本药物目录动态调整需求为出发点,选择疾病负担重、社会影响面广、社会关注度高、基本用药需求大、费用占比高的抗肿瘤药物作为优先评价对象,每年开展X个抗肿瘤药物评价项目。此外,还应承担国家药物和卫生技术综合评估中心指定的其他抗肿瘤药物评价任务,如特殊人群用药(新特药、应急和短缺类药品、孤儿药)及新入市药物的评价任务。

明确评价问题一般包括四个要素:确定目标人群,梳理评价药物信息,明确对照措施和确定结局指标。

1.确定目标人群

确定使用评价药物的目标人群,需要明确以下内容:评价药物的适应证人群(如肿瘤患者基因型、肿瘤分期),相关的人口学因素,亚组分析的必要性等。

2.梳理评价药物信息

梳理评价药物的通用名、商品名、生产厂家、剂型、规格、给药途径、给药剂量、给药频次、给药疗程等与评价药物有关的信息。

3.明确对照措施

对照可以是不进行任何干预、给予安慰剂、给予对照药物或进行其他干预措施。

4.确定结局指标

结局指预期达到的效果和可能造成的危害,评价工作组需要列出结局指标清单,从中遴选出体现安全性、有效性、经济性、创新性、适宜性和可及性的结局指标。

(二)评价设计

基于真实世界数据研究的常见评价设计类型包括:观察性研究(observational study)、实用临床试验(pragmatic clinical trial,PCT)、随机对照临床试验(randomized controlled trial,RCT)和使用真实世界数据作为对照的单臂试验。临床药品综合评价推荐采用观察研究作为主要评价方式,围绕药品的安全性、有效性和经济性,并结合评价维度下的评价指标,开展相关评价。可将评价结果与现有的其他类型研究设计结果进行相互验证。

1.观察性研究

观察性研究所采集的数据来自于真实世界(主要为医疗机构),但其最主要的局限在于存在各种偏倚、数据质量难以保证、观测和未观测的混杂因素较难识别等,使得研究结论具有很大的不确定性。

观察性研究所收集的数据是否适合产生真实世界证据,以支持监管决策,关注要点包括:①数据特征是什么?(例如,相关终点的数据采集、记录的一致性、是否有缺失数据的描述等)②研究设计和分析的特点是什么?(例如,有无合适的参考对象?考虑到潜在混杂因素以及潜在测量变异性,非劣效设计是否适用?)③预先确定了何种敏感性分析和统计方法对真实世界数据进行分析?

2.实用临床试验

实用临床试验又称实操临床试验,是指尽可能接近真实世界环境的临床试验,是介于RCT和观察性研究之间的一种研究类型。与RCT不同的是:PCT的干预既可以是标准化的,也可以是非标准化的;既可以采用随机分组方式,也可以自然选择入组;受试病例的入选标准较宽泛,对目标人群更具代表性;对干预结局的评价不局限于临床有效性和安全性等。与观察性研究所不同的是,PCT是干预性研究,具有相当的灵活性。

由于PCT需要考虑所有可能的潜在因素的影响,包括各种偏倚和混杂因素,故其研究设计和统计分析较为复杂,所需的样本量通常远超RCT设计。PCT如果采用随机化方法将减小混杂因素等偏倚的影响从而提供稳健的因果推断。此外,PCT在大多数情况下不采用盲法,对于如何估计和纠正由此产生的检测偏倚,需给予足够的重视,例如借助倾向评分(propensity scores,PS)方法,虚拟配对对照(virtual matched control)等统计方法实现来降低偏移。由于是在更接近真实临床实践环境下开展的研究,与其他研究类型相比,PCT所获得的证据被视为最好且可行的真实世界证据。

3.随机对照临床试验

随机对照临床试验被认为是评价药物安全有效性的金标准,并为药物临床试验普遍采用。RCT严格控制试验入组与排除标准和其他条件,并进行随机化分组,因此能够最大限度地减少影响因果推断的因素,使得研究结论较为确定,所形成的证据可靠性也较高。但RCT严苛的纳排标准可能会使试验人群对目标人群的代表性变差;有限的样本量和较短的随访时间导致对罕见不良事件探测不足等。这些局限性使得RCT的研究结论外推于实际临床应用时面临挑战。所以,对于某些缺乏有效治疗措施或危及生命的恶性肿瘤疾病,常规RCT在临床实践过程中难以实施,或需高昂的时间成本,亦可能引发伦理问题。抗肿瘤药物临床综合评价主要依托医疗机构患者层面真实世界数据实现,可将临床药品综合评价结果与评价药物的RCT结果进行比较,评价药品在真实世界中的安全性和有效性。

4.使用真实世界数据作为对照的单臂试验

单臂临床试验是指在临床试验设计时,不设立平行对照组,而仅采用外部对照来评价药物的安全性及有效性。与对照试验相比,单臂试验试验实施相对容易,周期短,常见应用于严重的或罕见疾病的临床研究。然而,使用外部对照具有局限性,主要包括医疗环境不同,医疗技术随时间变化,诊断标准不同,结局测量不同,患者的基线水平不同,干预多样化,数据质量难以保证等。这些局限使得研究对象的可比性、研究结果的精确性、研究结论的可靠性和外推性等均面临挑战。

为克服或减少这些局限,首先要确保所采集的数据符合真实世界数据的相关质量要求。其次,在设计方面,采用平行外部对照设计要优于历史对照,前瞻性平行外部对照可采用疾病登记模式,保障数据记录尽可能完整、准确。其三,在统计分析方面采用恰当的方法,如合理利用倾向评分方法,虚拟配对对照方法等。

(三)评价方法

1.文献综述法

(1)检索文献:

根据前期对核心问题的整理归纳,形成简练、有效的检索主题词并确定相关检索源。随后制定有效检索策略,确保检索的全面性。建议在MEDLINE、EMBASE、CENTRAL、CNKI、万方、维普等综合数据库,CDRs NHSEED(NHSEconomic evaluation database)、HEED(the Health Economic Evaluation Database)等卫生经济学数据库,及一些其他专业领域数据库,如PsycINFO、AMED、CINAHL等进行检索,另外也可检索在研临床试验数据库、临床实践指南数据库等。检索策略制定时,综合数据库可参考麦克马斯特大学的“hedges”;卫生经济学数据库可参考英国约克大学评审与传播中心(Centre for Reviews and Dissemination,CRD)官网(https://www.crd.york.ac.uk/CRDWeb/)。

检索方式建议首选计算机检索,同时辅以人工检索。检索顺序可参考“5S”循证信息服务模型(原始研究 Studies、证据汇总 Syntheses、循证摘要 Synopses、证据总结 Summaries、证据整合系统 Systems);建议关注证据级别高和推荐意见强的报告,如GRADE系统推荐的高质量证据。对文献质量的评定,也可参阅Cochrane文献质量评价标准或与相关Cochrane评价小组或相关检索专家联系。

(2)建立纳入、排除标准:

根据综述关注的实践领域、目标人群、评价药品、结局指标、研究类型等相关因素,建立合理的纳入和排除标准,对文献进行检索。同时按照摘要初筛、全文筛选和证据等级排序,对检索到的文献资源进行筛查。

(3)整合证据形成结果:

对以上检索到的资源信息,需要做进一步的证据分级评价和推荐强度的评定,以保障证据资源的可靠性。随后,根据文献异质性评价结果,决定是否选择Meta分析对多个研究疗效评估进行合并;对系统综述所纳入文献报告的主要结果、成本-效果等证据指标进行整合归纳,对证据和推荐意见进行解释说明。

(4)质量控制:

为了确保综述结果的可靠性,需要对操作环节进行质量控制,可参考如下操作:确认每一个操作过程是否正确规范并保存相关操作记录备查;对每一篇纳入文献进行质量评价;最终纳入的文献结果需由至少两名有相关经验的人士进行评价,对争议性的文献有必要进行审核复评,以使出现偏倚的概率降至最低并确保一致性;对未能达成一致的评价结果,则需另外具有相关经验的研究者在该研究被纳入证据基础前对其进行仲裁;文献综述结果在制定、形成和发表前还应进行小组内和组外同行评审,并记录内部与外部同行审评过程,如适用还需公布审评结果,以保证制定过程的严谨和透明。

2.一手资料研究

一手资料研究以评价药物在现实环境下的效果为目的,尤其注重观察长期应用效果、生活质量改善情况、不良事件、治疗负担等多元化目标结局,为抗肿瘤药物临床综合评价提供及时、全面的证据。在数据收集过程中应遵循以下步骤:

(1)伦理申请:

数据提取需通过数据采集单位伦理委员会审查和批准,表明数据提取目的,在充分保护患者隐私前提下进行。

(2)数据提取方案制定:

评价工作组根据评价计划制订数据提取方案,包括目标群体、药物等详细的识别编码及算法,变量所处模块及提取方式,确定提取字段信息格式,明确数据字典和验证规则,确保数据提取的完整性和准确性。必要时开展数据预提取以修正数据提取方案,确保不同数据采集单位收集数据的同质性。

(3)收集数据方法:

包括回顾性研究和并行/前瞻性研究。回顾性研究以归档电子病历为主要数据源,收集药物使用后的患者管理内容,包括药物治疗表、每日进展说明、护理进展说明、病理/生物化学检测结果、治疗药物使用监测结果。并行/前瞻性研究以在院患者的电子病历为主要数据源,在开具处方药物时确定筛选入组患者,并实时收集相关数据。

(4)数据提取:

评价工作组研究者经规范化培训后根据数据提取方案提取相关变量。首先根据识别编码识别数据采集单位目标群体及药物;其次根据事先制定的规则,对其他所需变量进行提取。对于需要随访方能获得的数据,需培训专门人员进行收集,要采用多种技巧降低失访数量。

(5)数据库构建:

根据数据要素的数量、参与的研究单位数、研究单位的分布、随访频率等因素构建电子数据库。选择纸质病例报告表(case report form,CRF)填写后录入、电子CRF表直接录入、移动客服端录入等多种录入方式将所提取数据录入构建的电子数据库,从而初步形成抗肿瘤药物综合评价数据库。

(6)数据清洗与标化:

制作数据清洗手册,依据变量信息建立相应的变量字典及清理规则,明确逻辑问题、参考值范围等,对获得的数据进行清洗,报告可疑数据并返回数据提取录入单位进行核实和更正。采用临床数据交换标准协会(Clinical Data Interchange Standards Consortium,CDISC)标准进行数据规范,使用标准字典(如Med DRA、WHODrug、WHOART)对所收集数据与字典中的词目进行匹配和编码。

(7)数据分析形成评价结果:

以解决临床医生和患者关注问题为主要目标,一手资料研究须做到客观、公正、可重复。数据分析前应进行数据预处理,包括:评估各类数据的相关性、真实性与可溯源性;处理离群值和缺失值。数据分析过程需关注所有可能的混杂因素和偏倚对研究结果的影响,选择合适的数学模型对可观测的混杂因素进行控制,同时充分说明并评估影响结果的不可观测因素。数据统计应结合数据类型和评价目标,酌情选择合理的统计学方法。

(8)质量控制:

一手资料研究质量控制要保证记录数据的真实可溯源,数据处理可重复,需要建立系统的随访规范并对研究人员进行监管。质量控制需贯穿数据提取、数据清洗与标化、数据分析等流程。数据提取过程需检查数据提取是否按照既定方案进行提取,核查数据的完整性、准确性和一致性。数据清洗与标化过程需检查是否保证按照既定制作数据清洗手册进行;是否论证丢弃信息对结果的影响;标准字典与数据词目是否对应。数据分析过程需检查混杂因素处理模型的设置是否合理;是否充分评估离群值及缺失值对研究结果的影响;是否分析可能的不可观测因素对研究结果的影响。

3.专家访谈法

在文献和一手数据研究的基础上,结合我国社会经济发展多样性的特点,从东、中、西部分别选取代表省份或在各试点省(市)辖区内选取不同经济发展程度的地市(区县)进行现场调研,对当地卫生健康行政部门、医保等政府部门有关负责人,有关专家、相关医疗机构负责人、药品企业和患者代表等进行深度访谈,一是梳理总结当前被评估药品相关治疗领域的现状和需求;二是听取各利益相关方对研究中所提出的评估维度和价值判断标准的建议、意见、认知和态度。

访谈方式为专题小组讨论和关键知情人访谈,主要借助访谈对象已有的实践经验和对研究目标的理解获取资料,可以客观、准确地反映利益相关者对临床综合评价维度和价值判断的态度、认知、思想和行为等方面的现状,直接或间接回答所设计的研究问题,并以此作为对文献检索结果和一手资料研究的相互补充。访谈工作的操作步骤包括:①通过文献检索确定访谈问题;②通过抽样或筛选的方式逐层择选访谈对象;③制定访谈指南和访谈问题提纲;④通过专题小组讨论、关键知情人访谈等方法收集定性资料;⑤分析资料,并进行效度和信度检测。对访谈资料的分析整理将应用主题综合法,主要包括标记和分类原文的信息和观点,再对标记和分类进行反复讨论,发现其间的异同点和联系,最后将原始研究中多样的信息和观点归纳为系统的几个主题。

4.模型分析法

在经济性评价中,常通过费用比较分析与药物经济学模型结果进行经济性判定。在费用比较分析中,假设条件为两种(或多种)药物治疗同一目标人群且效果一致,运用统计学手段开展比较分析。模型经常被用来比较治疗不同疾病干预方案的经济性。药物经济学评价模型通常是采用图形结构、公式等方式对疾病的自然转归过程和干预措施对该疾病转归过程的影响进行抽象模拟。在抗肿瘤药物经济学评价中,比较常用的经济学评价模型是马尔科夫模型和分区生存模型。

(1)费用比较分析:

当两种抗肿瘤药物具有相似的疗效时,可使用费用比较分析,数据来源为HIS系统中的患者费用信息、病案首页信息和日清单信息,推荐使用倾向评分匹配(propensity score matching,PSM)平衡基线信息,使用倍差法(difference in difference,DID)开展费用数值差异分析,使用间断时间序列分析(interrupted time series,ITS)开展费用趋势差异分析。同时可以收集医疗效率指标(如患者住院天数)等相关指标进行辅助比较。

1)倾向性评分:

由Rosenbaum和Rubin提出的倾向性评分方法,是一种针对较多协变量情况的混杂效应调整方法。若用X表示所有已观测协变量,T表示研究感兴趣的处理或暴露因素(T=1表示暴露),则倾向性评分定义为在观察到的协变量条件下,观察对象接受某种处理(或暴露)的概率PS=Pr[T=1|X]。倾向性评分可以综合概括特征变量的作用,反映所有已观测协变量在两组间的均衡性。Rosenbaum和Rubin已证明,如果对原始协变量进行调整能够有效控制混杂效应,那么,仅对基于这些协变量的倾向性评分进行调整,也足以控制混杂效应。倾向性评分通常可以通过回归模型估计得到,例如常用的以观测协变量作为自变量,处理情况作为因变量的Logistic回归模型:

logit[PT=1|X)]=α0+α1x1+…+αpxp+e

对于处理(或暴露)因素常见但是结局事件罕见,或可能存在多重结局的情况,倾向性评分方法尤其适用。利用倾向性评分进行因果效应估计,通常可采用的方法包括倾向性评分匹配法和倾向性评分分层法。

2)倍差法:

倍差法的原理是基于一个反事实的框架来评估干预发生和不发生这两种情况下被观测因素y的变化。干预前或基线有1个非随机对照组,干预前两组的效果变量存在差异d1,干预后两组又存在一个差异d2,实际干预效果是d1-d2,而不是d2,因为要考虑基线已有的差异d1。倍差法设计原理见图1-1-21。

图1-1-21 倍差法设计原理

3)间断时间序列分析:

间断时间序列在综合考虑事物原有发展趋势的基础上,通过干预措施前后状态的变化来判断措施的实施效果。利用时间序列建立下列模型:

Xt=β0+β1X1+β2X2+β3X3+εt

其中Xt是因变量,是描述客观事物的评价指标;β0是常数项,是起始阶段Xt的水平;β1为干预前事物的变化趋势,即斜率;β2为干预时的变化水平;β3为干预后事物的变化趋势与干预前的差值;β1+β3为干预后事物的变化趋势。X1是时间序列,编码为1,2,3…依次与观测点对应;X2表示观测点所处干预阶段,干预前的观测点用代码“0”表示,干预后依次用“1”表示;X3表示干预后时间序列,干预前的观测点用代码“0”表示,干预后依次用1,2,3…表示;εt表示随机误差。

(2)成本-效果分析、成本-效用分析:

成本-效果分析(cost effectiveness analysis,CEA)一般适用于比较药品只体现或主要体现在某一个临床产出指标时。基于临床药品综合评价数据来源,推荐使用从医疗机构直接获取的临床指标,如OS、PFS、ORR等,开展成本-效果分析。

成本-效用分析(cost utility analysis,CUA)通常将QALYs作为效用测量指标。使用该方法需要注意的问题是,不同的生命质量测量方法、测量工具以及效用积分体系均会对效用值产生影响,因此需要具体阐述效用值测量及计算方法。

(3)预算影响分析:

预算影响分析需要考虑以下因素:研究角度、目标人群、市场情境、研究类型、研究时限、市场份额、成本测量。依照设定的计算框架获得不同情境下的预估数值,并对其结果开展不确定性和情境分析,并通过验证获知分析结果的稳定性。预算影响分析的操作流程(图1-1-22)可参考ISPOR网站预算影响分析操作指南(ISPOR,2012)。

图1-1-22 预算影响分析流程图

经济学评价常规步骤如图1-1-23所示:

图1-1-23 经济学评价常规步骤

1)确定研究问题:

主要包括研究背景、研究目的与问题、研究角度、目标人群、干预措施与对照、研究时限等内容。

2)选择合适的研究方案:

按照数据收集时间和方式的不同可分为前瞻性研究、回顾性研究和混合性研究;按照是否进行模拟可分为模型研究和非模型研究等。

3)选择合适的评价方法:

研究者应当根据研究中干预措施的特点、数据的可获得性以及评价目的与要求选择适当的评价方法,常采用成本-效果分析(CEA)、成本-效用分析(CUA)和成本-效益分析(CBA)。

4)成本分析:

成本分析主要包括成本确认、成本测量与成本计价。

5)健康产出测量:

健康产出的三类测量指标包括疗效/效果、效用和效益。

6)模型分析:

药物经济学评价模型通常采用图形结构、公式等方式,对疾病的自然转归过程和干预措施对疾病转归过程的影响进行抽象模拟,重点关注此过程中的干预措施和发生的重要临床事件以及由此引起的健康变化和资源消耗情况。

7)贴现:

研究应该对发生在未来的成本和健康产出进行贴现,将其折算成同一时点的价值当量。

8)增量分析:

计算增量成本-效果比(ICER),即干预手段与对照手段的相对成本和效果之差的比值。

9)敏感性分析:

通常需要敏感性分析来解决评价的差异性和不确定性。

(4)马尔科夫模型:

马尔科夫模型是一种特殊的循环决策树模型,是一种将临床事件和相关干预实施的时间因素系统纳入模型模拟的动态模型。马尔科夫模型是对现实环境中患者健康状态连续变化的一种粗略的模拟,是一种离散时点状态转移模型。在该类模型中,研究时间被划分为等长的循环周期(cycles length)。模型中的患者被定义划分为有限个健康状态(health states/markov states),模拟中的每一个患者在每一个循环中必须且只能处于其中一个状态。用初始概率(initial probabilities)定义模拟开始时一组患者在各种健康状态中的人数分布,并通过转移概率(transition probabilities)矩阵定义每一个周期内患者从一种状态转移到另一种状态的可能性。通过定义每一个状态下一个周期内的成本和产出,累积计算整个研究时限内的总成本和总产出。研究者应依据恶性肿瘤的临床特点和研究数据的可获得性确定Markov模型中的患者健康状态。恶性肿瘤领域Markov模型中患者健康状态通常分为无进展(疾病稳定)、疾病进展、死亡,其Markov模型结构见图1-1-24。

图1-1-24 马尔科夫模型结构图

(5)分区生存模型:

分区生存模型(partitioned survival model,PSM)是一种评价抗肿瘤药物常用的成本-效用、成本-效果分析模型。PSM在概念上类似于状态转换模型,它们的特征是利用生存曲线定义一系列不同健康状态进行成本和产出的估计。例如,在恶性肿瘤经济学评价领域,通常使用恶性肿瘤临床试验中普遍报告的无进展生存和总生存两条曲线,将患者健康状态分为未进展、进展和死亡三个区域。每个健康状态有其特定的成本构成和效用值。研究人群在每个健康状态的比例分布直接由生存曲线中累积生存概率决定,需对疾病进展与死亡两种健康产出分别估计生存函数。随着时间推移,研究人群在不同健康状态中的分布由生存曲线下面积决定。PSM模型原理图见图1-1-25。

图1-1-25 分区生存模型原理图

结合以往研究经验,对评价方法进行梳理,从不同方法的所需条件、具体操作步骤、研究结果等多个方面进行归纳,综合考虑不同方法的优缺点,采用多种方法相结合的方式,做到互相弥补,互相印证,保证评价结果的科学性、准确性(表1-1-4)。

表1-1-4 评价维度与评价方法矩阵表

(四)数据资料来源

抗肿瘤药物评价方法包括文献综述法、一手资料研究、专家访谈法及模型分析法。其中,一手资料研究和模型分析法的数据来源于与患者使用药物以及健康状况有关的或来源于各种日常医疗过程所收集的数据(即真实世界数据);文献综述法相关数据主要来源于国内外文献数据库、政府网站、市场调查资料等;专家访谈法资料来源于对各利益相关方的专题小组讨论和关键知情人访谈。

1.真实世界数据的常见来源

(1)医疗机构信息系统(health information system, HIS):

包括结构化和非结构化数据字段的数字化患者记录,如患者的人口学特征、临床特征、诊断、治疗、实验室检查、安全性和临床结局等。

(2)医保系统:

包含有关患者基本信息、医疗服务利用、处方、结算、医疗索赔和计划保健等结构化字段的数据。

(3)疾病登记系统:

特定疾病(通常是慢性病)患者的数据库,通常来源于医院的疾病人群队列登记。

(4)国家药品不良反应监测哨点联盟(CASSA):

利用医疗机构电子数据建立药品及医疗器械安全性的主动监测与评价系统。

(5)自然人群队列数据库:

国内已经建立或正在建立的自然人群队列和专病队列数据库,是潜在的真实世界数据。

(6)死亡登记数据库:

由医院、疾病预防控制中心,和户籍部门联合确认的死亡登记所形成的数据库。

2.文献综述法数据的常见来源

主要包括:MEDLINE、EMBASE、CENTRAL、CNKI、万方、维普、药智等综合数据库,以及Center for Reviews and Dissemination(CRDs)、NHS Economic evaluation database(NHS EED)、The Health Economic Evaluation Database(HEED)、PsycINFO、AMED、CINAHL 等专业领域数据库。此外,政府网站信息、新闻信息和市场调研数据也可作为支持数据来源平台。

3.专家咨询法数据的常见来源

对卫生健康行政、医保等政府部门有关负责人,相关临床、药学卫生经济等专家,医疗机构负责人、药品企业代表和患者代表等进行深度访谈。借助访谈对象已有的实践经验,对临床综合评价维度和价值判断的态度、认知、思想和行为等方面的现状进行客观描述,并以此作为对文献检索结果的相互补充。

(五)评价实施

评价工作组按照评价计划实施评价,评价实施的每个步骤应保证至少2名评价组工作人员参与,1名评价组工作人员复核。评价的过程、产生的中间数据、结果均应有详细记录并签字确认,保证评价结果可追溯。评价专家指导组对评价计划进行审阅和批复,确保评价实施过程有良好的质量控制。评价工作建议以试点先行、逐步推开的方式实施。

(六)评价结果

按照国家药品临床综合评价指南要求,完成抗肿瘤药物临床综合评价后,评价工作组以评价报告形式(报告标准格式见附录五)对所有具体评价问题进行汇总,汇总结果提交评价专家指导组,由评价专家指导组给出建议和评价结论。获得专家认可后,形成评价报告终稿,提交国家药物和卫生技术综合评估中心验收。

附录一 抗肿瘤药物临床综合评价项目计划书

表1-1-5 抗肿瘤药物临床综合评价项目计划书

附录二 实体瘤疗效评价标准指南(1.1版)

表1-1-6 实体瘤疗效评价标准指南(1.1版)

续表

附录三 常见不良事件评价标准(CTCAE 5.0版)节选

表1-1-7 常见不良事件评价标准(CTCAE 5.0版)节选

续表

续表

续表

注:等级是指不良事件的严重程度。CTCAE根据下面的一般准则对各个不良事件的严重程度(1级至5级)作了特定的临床描述:

1级:轻度;无症状或轻微症状;仅为临床或诊断所见;无需治疗。

2级:中度;需要较小、局部或非侵入性治疗;与年龄相当的工具性日常生活活动受限。

3级:严重或者具重要医学意义但不会立即危及生命;导致住院或者延长住院时间;致残;自理性日常生活活动受限。

4级:危及生命;需要紧急治疗。

5级:与AE相关的死亡。

日常生活活动(activities of daily living,ADL):

工具性日常生活活动指做饭、购买衣物、使用电话、理财等。

自理性日常生活活动指洗澡、穿脱衣、吃饭、盥洗、服药等,并未卧床不起。

附录四 《中国药品综合评价指南参考大纲(第2版)》节选

表1-1-8 《中国药品综合评价指南参考大纲(第2版)》节选

续表

附录五 标准报告格式

表1-1-9 标准报告格式

续表

续表

第三节 心血管病药品临床综合评价技术指南

冠心病、脑卒中等心血管病已成为我国居民死亡和疾病负担的首要病因。1990—2016年,每年因心血管病导致的死亡在总死亡中所占的比例从25%增至40%。心血管病患病率也逐年攀升,全国有超过2.9亿人受累。据世界银行预测,随着生活方式改变及人口老龄化的加剧,中国心肌梗死患者数将从2010年的810万增至2030年的2 260万,脑卒中患者数同步将从820万增至3 180万。同时,由于心血管病病情迁延、致残率高,我国每年心血管病治疗总花费高达3 098亿元,社会和家庭负担沉重。当前,我国心血管病防治领域缺乏基于诊疗质量和患者预后的药品临床综合评价和药物政策研究,急需围绕心血管病防治药物长期安全有效的证据信息,依据国家药品临床综合评价管理政策和制度规范,制定心血管病药品临床综合评价技术指南,进一步科学规范心血管系统用药有关的基本药物遴选,完善国家基本药物目录动态调整机制建设。

为指导和规范卫生健康系统开展心血管病药品临床综合评价,国家心血管病中心、首都医科大学附属北京安贞医院、国家卫生健康委卫生发展研究中心(国家药物和卫生技术综合评估中心,以下称“国家评估中心”)联合成立指南起草小组,听取全国医药行业学(协)会意见,组织全国医学、药学、卫生经济学、卫生政策等领域及地方医药卫生方面的专家共同制定本技术指南。

本技术指南根据《国家药品临床综合评价管理指南(试行)》,参考借鉴国际心血管病药品评价有益做法和经验,并根据我国心血管病药品临床技术评价实际情况制定,有助于逐步实现全国心血管病药品临床综合评价工作的科学化、同质化、规范化。

本技术指南为心血管病药品临床综合评价的总规范,适用于国家和省级卫生健康药政管理机构遴选心血管病防治用药目录,评价心血管病药物政策,主要明确相关组织和所涉及医疗卫生机构参与心血管病药品临床综合评价的重点内容、具体流程,包括评价主题遴选、证据评价、质量控制、政策评审、结果转化等。

一、评价内容与维度

心血管病药品临床综合评价是应用多种方法对多维度、多层次证据的综合评价过程,重点围绕安全、有效、经济、创新、适宜、可及6个维度进行定性及定量数据整合分析,充分利用大数据、区块链、人工智能等技术,结合患者分子分型与用药预后相关性效益研究分析,以及重大疾病基本药物精准使用,形成药品价值判断的综合依据。本技术指南涉及的心血管病药物主要包括:抗心绞痛药、抗心律失常药、抗心力衰竭药、抗高血压药、抗休克药、调脂及抗动脉粥样硬化药和抗栓药等。

(一)安全性评价

考虑到心血管病药品上市前存在试验对象、样本量、随访时间等限制,以及部分罕见不良反应、迟发不良反应和发生在某些特殊人群的不良反应难以被发现等情况,本技术指南心血管病药品安全性评价主要结合上市前后药品安全性信息进行全面评价,重点包括药品安全性信息收集和同类药品安全性比较两个方面。

药品安全性信息收集包括药品概况、企业概况、政府措施、安全性信息及用药差错信息等。其中,①药品概况指药品名称、成分(含特殊赋形剂)、剂型、规格及全球上市信息等;②企业概况指生产企业信息及是否存在或发生过药品质量问题等;③政府措施指国内外政府是否对相关药品发布过撤市、警告、修改说明书等措施;④安全性信息指说明书中药品相关安全性信息,主要为药品上市前的安全性信息,包括致癌、致畸和生殖毒性、禁忌证、药物相互作用、药物过量、特殊人群用药(妊娠及哺乳期妇女、儿童、老年及肝肾功能损害患者等)、不良反应及人种间安全性差异等;⑤用药差错信息指出现用药差错的案例及原因(表1-1-10)。

表1-1-10 药品安全性信息表

同类药品安全性比较指与对照药品比较的安全性差异,即不良反应发生率和/或严重程度的差异。重点考察真实世界中药品安全性差异、远期安全性差异、不同人群中安全性差异等。

为了便于开展安全性评价研究,本指南对常用心血管病药品需要关注的主要不良反应进行归纳(附录二,其中具体不良反应的判断标准及严重程度可参考相关疾病诊断标准、通用不良事件术语标准5.0版(Common Terminology Criteria for Adverse Events v5.0,CTCAE v5.0)。

(二)有效性评价

通过定量分析,对评价药品及其对照药品的临床有效性进行科学评价。心血管病药品有效性评价的指标主要采用能反映疾病预后情况的硬性终点指标,包括主要不良心血管事件(major adverse cardiovascular events,MACE)、全因死亡、心血管死亡、心肌梗死、心力衰竭、脑卒中、血运重建等。当不能采用上述硬性终点指标进行评价时,也可采用能反映重要临床结局的实验室测量指标、临床症状或体征变化等替代终点指标。心血管病药品类别多,不同药品有效性替代终点指标差异明显。本技术指南对心血管病药品的常用替代终点指标归纳列表(附录三)。

开展临床有效性评价的数据应来源于所有当前可得质量最佳的相关研究和真实世界数据,重点利用国家药品临床综合评价信息平台和评价分中心的数据,充分整合数据资源开展基于随机对照试验(randomized controlled trial,RCT)、实用临床试验(pragmatic clinical trials,PCT)和真实世界数据的效果分析,并详细阐明证据本身的可靠性(包括部分证据可能的缺陷及其可能带来的结果不确定性)。

(三)经济性评价

心血管病药品经济性评价是应用经济学的理论基础,比较分析心血管病药品之间的经济成本和健康回报,进而形成决策所需的优选方案。针对确定的评价主题,可在采用列队研究评价药物安全性或有效性的同时对药物的经济性进行评价。根据评价决策需求,主要选择运用成本-效果分析(cost-effectiveness analysis,CEA)、成本 -效用分析(cost-utility analysis,CUA)、成本 -效益分析(cost-benefit analysis,CBA)、最小成本分析(Cost minimization analysis,CMA)等4种方法,以及增量分析的方式。在条件允许的情况下优先考虑成本-效用分析。经济性评价实施主要参考现有药物经济学评价指南,主要包括中国药物经济学评价指南、中国药物综合评价参考大纲以及国际药物经济学和结果研究协会等发表的系列指南。

成本-效果分析(CEA)适用于比较相同临床产出的不同方案,通常以生命年、无症状天数等作为衡量指标,健康产出指标为临床效果指标。当心血管疾病治疗方案的产出指标只体现或主要体现在某一个临床产出指标时,可考虑使用成本-效果分析。当心血管疾病治疗效果有多个指标反映时,应采用对疾病治疗或者对患者最为重要的效果指标,可以多个效果指标分别进行成本-效果分析。

成本-效用分析(CUA)适用于临床产出指标不同的心血管病药物之间的比较分析。通常采用质量调整生命年(quality-adjusted life years,QALYs)作为CUA的健康产出指标,既体现治疗方案对患者生存时间的影响,也体现对生命质量的影响,尤其适用心血管等慢性病治疗药物的经济性评价。同时应注意,不同的生命质量测量方法、测量工具和效用积分体系均会对效用值产生影响,评价报告应具体阐述效用值的测量方法。

成本-效益分析(CBA)的成本和健康产出均采用经济指标衡量,将健康产出通过支付意愿法或人力资本法等方法转换为货币指标,进而进行净效益计算。在评价中需要解释健康产出转换成货币值采用的所有步骤和方法,并使用敏感性分析验证主要假设。当心血管病药物的健康产出难以采用质量调整生命年或其他任何单个效果指标测量时,可采用成本-效益分析。

当有证据显示,经济性评价的心血管病药物及其对照药物的重要临床产出相同或无临床意义差异时,可选择最小成本分析(CMA)的评价方法。在证明不同心血管病药物临床产出的无差异时,统计学无差异和临床无差异均可以接受,当存在公认的临床无差异标准时,以临床无差异为准。

CEA和CUA是按照增量分析结果进行决策,在干预药物和对照药物之间进行成本和健康产出两个维度的比较,主要是计算两方案之间的增量成本-效果比(incremental cost-effectiveness ratio,ICER),即成本之差和效果之差的比值。ICER=(C1-C2)/(E1-E2)=∆C/∆E。ICER对比意愿支付阈值,决定干预药物相较于对照药物是否更加经济。

经济性评价指标的测量涉及成本测量和健康效用值的测量。成本测量时应首先列出与实施干预措施相关的资源项目,明确评价项目的计量单元,再根据该计量单元测算消耗的资源数量。成本的计量单位可以是比较宏观的,如一年就诊、一次住院、一次门诊等单位;也可以是比较微观的,如一片药品、一次注射、一次护理等。在数据可得的情况下,应尽可能使用微观的计量单位。在进行成本测量时应优先推荐使用基于中国人群的基础数据。若无法获得基于中国的基础数据,则应对来自国外的数据进行校正,使其适用于中国。健康效用值的测量方法包括直接测量法与间接测量法,优先推荐使用间接测量法。当没有适用的间接测量工具来获得某些疾病或症状的健康效用值时,可以使用直接测量法。间接测量法中常用的健康效用量表包括欧洲五维健康量表(euroqol-5 dimensions,EQ-5D)和六维健康调查简表(short-form six-dimensions,SF-6D)等;对于儿童建议使用针对儿童的健康效用量表(pediatric quality of life inventoryTM,PedsQLTM)。常用的直接测量法包括标准博弈法(standard gamble,SG)、时间权衡法(time trade-off,TTO)和离散选择实验法(discrete choice experiment,DCE)等。

(四)创新性评价

基于心血管病药品对患者的临床应用价值,对创新性进行判断的依据主要有:①在治疗方案、适应证和治疗效果方面存在技术创新(如解决临床没有满足的需求、改善此领域技术短缺现状),如填补临床治疗技术空白、改善技术短缺(药品纳入专利范畴),在全球、中国的原研药,或在国内首仿。②在心血管病治疗方面有更高的安全性(不良反应等级低及不良事件少)、有效性和生活质量(改善患者预后和生活质量),包括生存时间的延长、生命质量的提升、不良反应和并发症的减少等。③在药品使用方面,是否优化给药方式,有助于提高患者用药依从性、促进预后等。

(五)适宜性评价

心血管病患者用药适宜性是指在适宜处方的指导下,通过适宜的方式,精确的作用于目标人群。药品适宜性评价重点包括:适应证及分子分型亚组人群适应证、药品临床使用方式方法(剂型剂量、储存和给药条件)、现行药品管理规范和居民用药需求、与当前分级诊疗服务体系管理的适宜性等,以及在药品使用、采购、配送和报销方面是否存在管理门槛和壁垒。必要时,从卫生健康服务体系等全社会价值视角研判药品对患者福利和社会发展的影响。主要从人群适应证、处方审核及药品技术特性等方面对心血管病药品的适宜性进行评价。

重点考察心血管疾病不同亚组的治疗获益和风险,利用人群队列中的组学数据、公共基因库信息以及相关的临床资料等真实世界数据,获取真实世界证据,以支持心血管病药物精确目标人群适应证。

心血管药品的技术特性主要包括如下指标:①剂型:剂型、给药途径及每日次数;②剂量单位:单次用药数量、是否有划痕方便分剂量;③药品包装和外观:异味、异嗅、异形、特殊颜色(尤其对儿童)、是否按疗程用量包装;④药-药/药-食相互作用:是否存在联合用药的禁忌与风险、是否需要禁忌食物;⑤说明书信息:专业术语是否准确、内容是否全面、表述是否清楚、有无误导、是否更新、是否有英文说明书便于外籍患者阅读或便于国际医疗救援活动;⑥用药监测:是否需要进行血药浓度、肝肾功能、血象、其他特殊指标监测;⑦给药间隔:是否需要护士按特殊给药时间发药或配制;⑧给药期间限制条件:避免日晒、忌饮酒、忌奶制品、中药有无禁忌;⑨储存与运输:是否在存储及运输过程中需要进行冷藏、冷冻、避光等特殊储存条件;⑩配制和给药难易程度:包装(大小、易损程度)、效期标示、是否需要即配即用、特殊输注速度等。

(六)可及性评价

心血管病药品可及性评价可参考WHO/HAI药物可及性标准化方法,主要从药品的价格、可获得性和可负担性三个方面进行可及性评价。

1.药品价格水平

获得待评价药品采购价格,计算中位价格,与最近一年的国际药价指南的价格(management sciences for health,MSH)进行比较,计算中位价格比(median price ratio,MPR)。比较国际药价时需采用购买力平价指数进行货币换算,一般认为MPR≤4时,药价基本合理。

2.可获得性

采用调查机构药品的配备率和药品的可获得率来反映药品可获得性。调查机构药品配备率RH=该机构配备通用名药品数/调查通用名药品总数×100%。某地区或某类调查机构总体药品配备率为该地区或该类调查机构药品配备率的中位数。某通用名药品可获得率RM=配备该药品的机构数/调查机构总数×100%。通过抽样调查获得,一般认为配备率<50%为可获得性较低,50%~80%为可获得性较好,>80%为可获得性好。

3.可负担性

可负担性指心血管病患者家庭对于药品治疗费用的负担能力情况,推荐采用家庭灾难性支出概念判断可支付性。结合我国实际,建议指标采用人均年用药治疗费用占城乡居民家庭年可支配收入比重。还可采用非政府雇员最低工资法评价可负担性,原则上急性疾病按7天用量,慢性疾病按30天用量计算每种疾病的疗程费用,当药品治疗期总费用在1倍最低日薪以下,可认为该药物治疗方案可负担性良好。

二、评价设计与分析方法

(一)评价类型

心血管病药品临床综合评价可分为快速评价和完整评价两种类型。评价人员根据评价目的、评价时限等因素选择评价类型。当评价任务完成时间有限时,建议采取快速评价这一快速决策工具,通过简化卫生技术评估或系统评价的方法和流程,或基于专家咨询/问卷,快速评价心血管病药品的安全性、有效性和经济性。完整评价用于综合评价药品的安全性、有效性、经济性、创新性、适宜性和可及性。

(二)评价原则与步骤

1.评价背景

评价背景需提供的信息主要包括待评药品相关适应证的疾病流行病学概况、医疗服务利用情况、经济负担情况、主要干预措施(如国内外临床诊疗指南对治疗方案的推荐,包括药物与非药物)、全球范围内相关干预措施的有效性、安全性和经济性等的评价现状、临床上或政策上存在的主要问题、待评药品的优势,以及本研究的价值(必要性和重要性)等。

2.评价角度

评价的角度主要包括全社会角度、卫生体系角度、医疗保障支付方角度、医疗机构角度和患者角度等。推荐采用全社会角度和卫生体系角度对心血管病药品进行综合评价。

3.目标人群

开展评价需要明确目标人群,制定纳入标准与排除标准。通常,目标人群与药物的适用人群一致。应当采用流行病学特征描述目标人群的患者类型,如年龄、性别、疾病类型与严重程度、有无其他合并症或危险因素、社会经济特征等。根据需要可对临床亚组人群开展评价分析。亚组分析可以按人群特征、疾病亚型、严重程度以及有无合并症等分组。

4.评价药品及对照药品

评价药品和对照药品的描述应该包括剂型、规格、用法用量、合并用药和治疗背景等信息。对照药品(一般为适应证相同的标准治疗方案)的选择必须包括国家评估中心给出的评价任务书中规定的对照药品。

(三)叙述性文献综述

描述性文献综述又称叙述性文献综述(narrative review)是心血管病药品临床综合评价的基础性工作。描述性文献综述是由评价人员根据心血管病药品评价内容和指标,收集有关的文献、资料,采用定性分析的方法,对文献中阐述的研究目的、方法、结果、结论和观点等进行分析和评价,用自己的判断和观点,整理综合而成文,为评价工作提供证据支持。基本步骤包括确定综述目的、收集相关的文献原始资料、阅读和评价文献、撰写文献综述等。叙述性综述对具体临床问题的定量解决作用有限,可在需全面了解某一问题时使用。

(四)系统评价

系统评价一般被认为是质量等级最高的研究证据。针对心血管病药品临床综合评价的决策问题,全面系统地收集全世界已发表或未发表的临床研究结果,采用临床流行病学,严格评价文献的原则和方法,逐个进行严格评价和分析,筛选出符合质量标准的文献,进行定性或定量合成,得出综合可靠的结论。其操作步骤主要为:

1.提出问题可参考Cochrane干预措施评价手册的PICO(S)原则提出明确、可解答的临床问题,对以下研究内容做精确的描述:涉及什么样的患者(participants)、涉及何种干预措施(intervention)、涉及何种比较方法(comparisons)、涉及何种疗效指标(outcome)、采用何种研究手段(study design)。

2.制定检索策略,检索文献需要进行全面而系统的文献检索,主要包括电子检索、手工检索、向作者查询补充信息,了解有无未发表的文章等情况,向相关领域的专家学者及药品生产厂家了解更多信息。检索策略的制定要充分考虑避免潜在的文献发表偏倚,确保检索策略的全面、准确、具体,并报告系统评价过程中每个数据库的检索策略。

研究者必须至少检索一种国内大型数据库,如万方、CNKI,和至少一个国外大型数据库,如MEDLINE、EMbase。除以上数据库外,还应检索权威报告、药品说明书、注册资料、临床试验注册网站等,以便了解是否有正在进行的相关临床试验,可否获取未发表的临床试验结果。手工检索即是通过阅读专业杂志、会议论文摘要等,查找符合纳入标准的文献。手工检索可补充电子检索的疏漏,应引起重视。从已纳入文献的参考文献中检索也是重要的手段。高质量的论文一般会引用丰富的相关研究文献,其中可能含有电子检索和手工检索都未能检出的有价值的文献。

3.确定纳入文献文献的纳入须根据已制定的纳入与排除标准,由至少两位研究者独立地进行。通过对检出文献的标题、摘要及全文依次阅读,逐步排除一些不相关的文献,对可能纳入的文献,务必在阅读全文时重视其材料与方法部分的评判。两位研究者在确定是否纳入的意见上不一致时,应分析原因,如系原文描述不清,可与原文作者联系以获悉相关资料,并与第三位研究者进行讨论。二者的一致性程度可通过Kappa检验计算。在纳入过程中,应去除重复的研究,否则会影响分析的结果。对于某些可能为同一研究的文献,应当向作者发信以确认。

4.数据提取提取的内容主要包括①纳入研究的基本信息:文献题目、第一作者、发表时间、发表国家和文献来源等;②研究方法及可能存在偏倚:分组方法、分组方法是否隐藏、是否采用盲法、是否对失访与退出进行描述、是否存在选择性报道等;③研究对象特征:入选及排除标准、例数、年龄、性别等;④干预措施:药物名称、给药途径、剂量、治疗时间、对照方式等;⑤结局指标:终点事件发生率、不良反应发生率等;⑥结果:表示形式有分类变量、连续性变量,应注明样本量及每个研究的样本含量、失访人数、可信区间精确度及亚组分析情况等;⑦混杂因素:基金来源、作者得出的关键性结论、作者对混杂因素的评价、其他研究对混杂因素的评价等。

5.证据质量评价证据质量评价主要包括两个方面:一是对纳入系统评价的单个研究的偏倚风险评估,可参考Cochrane干预措施评价手册,二是对总体证据的质量分级,可利用证据质量和推荐强度分级系统(grades of recommendations assessment,development and evaluation,GRADE)。

6.数据分析数据分析是定量系统评价的重要环节,主要是运用Meta分析将多个研究中相同变量的结果合并。目前可用于Meta分析数据合并的软件主要有RevMan、Stata、Comprehensive Meta Analysis等。

(五)随机对照试验

随机对照试验是一种用随机分组的方法将患者分到各比较组来比较不同治疗作用大小的研究方法。强调将研究人群随机分为试验组和对照组,将研究者所控制的措施施加给试验人群后,随访观察并比较两组人群的结局,以判断干预措施的效果。试验步骤包括:制订试验计划、确定研究人群、确定样本含量、设立严格的对照、随机分组、应用盲法、收集整理与分析资料等。具体内容可参考流行病学规范教材等。

(六)实用临床试验

实用临床试验又称实操临床试验,是指尽可能接近临床真实世界环境的临床试验,它是介于RCT和观察性研究之间的一种研究类型。与RCT所不同的是,PCT的干预既可以是标准化的也可以是非标准化的;可以采用随机分组也可以自然选择入组;受试病例的入选标准较宽,对目标人群更具代表性;评价干预的结局不局限于临床有效性和安全性等。与观察性研究所不同的是,PCT是干预性研究,尽管干预的设计具有相当的灵活性。具体内容可参考真实世界证据支持药物研发的基本考虑等。

(七)横断面研究

横断面研究是常用的描述性研究方法,也称为现况研究,是收集特定时间、特定范围内某人群的信息,用患病率等统计指标描述人群中疾病及健康问题。可以为评价人员提供待评价心血管病药品治疗疾病在某一时间点的状况,为卫生决策和进一步的分析性研究提供线索和依据。横断面研究方法包括普查、抽样调查及典型调查。具体内容可参考卫生统计学规范教材等。

(八)队列研究

队列研究又可分为回顾性队列研究和前瞻性队列研究。前瞻性队列研究是队列研究的基本形式,即在研究开始时,根据每个研究对象的暴露情况对研究对象进行分组,此时研究结局还没有出现,需要随访观察一段时间,收集每个研究对象研究结局的发生情况。回顾性队列研究是根据研究开始时研究者已掌握的有关研究对象在过去某个时点暴露状况的历史资料进行分组,研究的结局在研究开始时已经发生,不需要前瞻性观察。在这种队列研究中,暴露与结局均来源于有关的历史记录或档案材料,如医院的病历、个人的医疗档案等,可以在较短时期内完成资料搜集,不需要进行随访观察。具体内容可参考流行病学规范教材等。

(九)病例报告研究

病例报告(case report)是对单个病例或少数几个病例所观察到新问题的详尽临床报告,常用于临床诊疗过程中对一些异常特征或表现的报道。在病例报告中,要写明病例的来源、研究现场、诊断方法和标准、治疗方法(使用的设备、治疗方案及疗程等)、结局指标的选择和检测方法、疗效判断标准等。在临床研究中病例报告研究主要用于发现新的疾病或提供病因线索;探讨疾病的致病机制和治疗方法的机制;介绍常见疾病的罕见表现。当开展心血管病药品安全性、有效性评价时,可用来获取部分补充证据。

(十)关键知情人访谈

知情人是指拥有调查内容相关的知识信息并愿意向访谈者提供的人。关键知情人访谈是个体访谈的一种类型,其适宜了解在公众场合或专题组访谈中不宜询问的问题,能选择受访者方便的时间和地点进行,容易取得受访者的配合。多用于心血管病药品临床综合评价中一些小规模及一些敏感性问题的调研,也常用于一些个案研究。

关键知情人访谈步骤包括:①准备访谈提纲和必要的工具;②选定调查对象,应注意访谈对象的代表性,选择来自不同领域、代表不同利益方等的访谈对象;③约定进行访谈的时间和地点;④进行关键知情人访谈,对访谈内容进行详细记录;⑤对关键知情人访谈资料进行分析和解释等。

(十一)焦点组访谈

焦点组访谈是通过召集一小组同类人员,对某一研究议题进行讨论,得出结论的定性研究方法。对心血管病药品开展临床综合评价过程中,可召集卫生健康和医保等行政部门有关负责人、专家、医疗机构负责人、药品企业和患者代表等分别进行焦点组访谈,梳理总结当前被评价药品相关治疗领域的现状和需求,听取各利益相关方对研究中所提出的评价维度和价值判断标准的建议、意见、认知和态度。

焦点组访谈主要包括以下步骤:①制订焦点组访谈计划;②确定小组的数量及类型,一般需要2~3组;③制定调查提纲;④培训调查人员、进行预实验;⑤焦点组访谈准备工作,包括人员准备和场地准备;⑥进行焦点组访谈;⑦对焦点组访谈结果进行分析与解释。

(十二)模型研究

模型研究一般采用图形结构、公式等方式对疾病的自然转归过程和干预药物对该疾病转归过程的影响进行模拟。模型需要体现干预药物和重要临床事件,以及由此引起的健康变化和资源消耗情况。构建模型可参考相关指南或规范。药物经济学评价中使用的模型主要包括决策树模型、马尔科夫(Markov)模型、离散事件模拟模型(discrete events simulation model,DES)、分区生存模型(partitioned survival model,PSM)、流行病学模型(epidemiologic model)、系统动力学模型(system dynamics model,SDM)等。心血管药品经济性评价推荐使用决策树模型和马尔科夫模型。开展模型研究的主要步骤如下:

1.模型问题描述建模的第一个步骤是对评价问题进行描述,明确列出心血管相关疾病、模型目的、目标人群、干预措施、研究角度、模拟范围、健康及其他产出以及研究时限等信息。

2.模型类型选择模型的选择要充分考虑心血管相关疾病和干预措施的相关特点,选择后说明使用的分析模型和选择的合理性。可根据心血管疾病的临床特点(如发病与患病特点、疾病自然转归特点、临床治疗路径特点等)以及研究数据的可获得性,对模型类型进行选择。优先推荐使用马尔科夫模型,如果马尔科夫模型不适用,可考虑使用决策树等其他模型形式。

3.模型结构构建模型的构建需要以疾病转归特点以及干预措施对疾病转归过程的影响为依据。模型结构包含不同干预方案之间对患者健康和成本影响有显著差异的事件。建议模型使用结构图展示,并对模型结构加以验证。在马尔科夫模型中,研究时限应足够长,模型周期应足够短,建议进行半循环校正。

4.模型参数来源模型中所有参数的来源和选择依据需要进行详细说明。通过不同的数据来源途径收集真实世界数据,同时可选择系统评价文献中的相关数据作为参数来源。心血管病药物经济性分析模型可模拟在真实环境中进行疾病干预的经济性,大样本、高质量的真实世界研究结果更加合适。

5.模型假设对于模型中存在的各种因果关系、使用的外推技术、模型范围、结构及数据等方面必要时可作出假设,并对其进行解释和说明。应对重要的假设进行不确定性分析。

6.模型验证对所构建的心血管病药物经济性评价模型进行验证,包括表面效度、内部效度、外部效度等。表面效度包括对模型模拟的具体问题、结构、参数和结果进行专家意见的验证。内部效度包括对参数的来源、参数估计方法和参数设定正确合理的验证。外部效度包括选择最合适的数据来源进行外部效度验证,并说明所选择数据的理由。

三、数据来源

(一)真实世界数据

真实世界数据主要是指心血管病药品在全国或一定区域的较大患者人群在较长时期的实际诊疗全过程的具体效果和数据结果。包括医疗机构药品采购使用数据、安全合理用药监测数据、患者健康状态数据、队列随访数据和不良反应监测等。根据评价需求,制定心血管病药品临床综合评价数据集,从承担评价任务的区域内医疗卫生机构的电子健康档案、电子病历(electronic medical record,EMR)、医学影像(如picture archiving and communication systems,PACS)、检查检验(如 laboratory information management system,LIS)、门诊处方等数据中,按规范要求脱敏敏感信息,标识和调取涉及药品综合评价的真实信息。

(二)循证证据和文献数据

中文检索数据库包括中国学术期刊网数据库、万方数据库、维普数据库等;英文数据库包括Medline、Embase、PubMed、Ecolit、OVID、Cochrane Library、EBSCO、Springer等。还包括咨询公司、大学、制药企业的数据库,权威报告、药品说明书、注册资料、企业申报资料、FDA网站、原SFDA网站、新闻媒体和市场调查资料、WHO国际临床试验注册平台(WHO ICTRP)等。

(三)专家咨询数据

对卫生健康、医保、药监等行政部门有关负责人,心血管病相关临床、药学、药物经济学等领域专家,以及医疗机构负责人、药品企业和患者代表等进行访谈。根据访谈对象已有的实践经验,对心血管病药品临床综合评价维度和价值判断的典型经验、真实态度、临床认知、决策思想和执行行为等方面的现状进行客观描述。

附录一 标准报告格式

表1-1-11 标准报告格式

续表

附录二 心血管病药品安全性评价常用指标

(一)抗心绞痛药

主要包括β受体阻滞剂、硝酸酯类药物、钙通道阻滞剂(calcium channel blocker,CCB)及其他类(尼可地尔、曲美他嗪等),此处重点阐述硝酸酯类药物、尼可地尔及曲美他嗪的安全性指标,其余药物则在后续分类中阐述。

1.硝酸酯类药物

头痛、面部潮红、心率加快及低血压。

2.尼可地尔

头痛、眩晕、乏力、恶心、低血压及黏膜溃疡。

3.曲美他嗪

胃肠道反应、头痛、头晕、运动障碍。

(二)抗心律失常药

主要包括:Ⅰ类:钠通道阻滞剂,含奎尼丁、普鲁卡因胺、丙吡胺、利多卡因、美西律、普罗帕酮等;Ⅱ类:β受体阻滞剂,含普萘洛尔、阿替洛尔、美托洛尔等;Ⅲ类:延长动作电位时程的药物,含胺碘酮、索他洛尔、伊布利特等;Ⅳ类:钙通道阻滞剂,含维拉帕米、地尔硫等;其他类:含腺苷等。

抗心律失常药的主要不良反应包括两个方面,即心脏毒性和心脏外毒性,其中心脏毒性主要包括致心律失常作用、恶化心功能及负性肌力作用。常用抗心律失常药的不良反应如下:

1.利多卡因

心脏毒性:窦房结抑制、房室传导阻滞;心脏外毒性:眩晕、感觉异常、意识模糊、谵妄、昏迷。

2.美西律

心脏毒性:低血压、心动过缓;心脏外毒性:恶心、呕吐、运动失调、震颤、步态障碍、皮疹。

3.普罗帕酮

心脏毒性:低血压、传导障碍、心动过速;心脏外毒性:头晕、胃肠道反应、肝功能异常、支气管痉挛。

4.β受体阻滞剂

心脏毒性:低血压、心动过缓、心力衰竭、反跳现象;心脏外毒性:诱发或加重哮喘、间歇性跛行、雷诺现象、精神抑郁、乏力。

5.胺碘酮

心脏毒性:心动过缓、致心律失常、负性肌力作用;心脏外毒性:肺纤维化、转氨酶升高、甲亢或甲减。

6.索他洛尔

心脏毒性:心动过缓、致心律失常、尖端扭转性室速。

7.伊布利特

心脏毒性:心动过缓、传导阻滞、QT间期延长、尖端扭转性室速;心脏外毒性:恶心、头痛。

8.维拉帕米

心脏毒性:低血压、心动过缓、房室传导阻滞、心搏停顿;心脏外毒性:偶有肝毒性。

9.腺苷

心脏毒性:窦性停搏、室性期前收缩或短阵室速;心脏外毒性:呼吸困难、胸部压迫感。

(三)抗心力衰竭药

主要包括利尿剂、肾素 -血管紧张素系统抑制剂[(angiotensin-converting enzyme inhibitor,ACEI)、(angiotensin receptor blocker,ARB)、血管紧张素受体脑啡肽酶抑制剂(angiotensin receptor neprilysin inhibitor,ARNI)]、β受体阻滞剂、醛固酮受体拮抗剂、伊伐布雷定、正性肌力药(洋地黄类药物、多巴酚丁胺、多巴胺、米力农、去甲肾上腺素、异丙肾上腺素、左西孟旦等)、血管扩张剂(硝普钠、硝酸酯类、重组人脑利钠肽等)、改善心肌能量代谢药等。此处重点阐述洋地黄类药物、左西孟旦、ARNI、伊伐布雷定及重组人脑利钠肽的安全性指标,其余药物则在后续分类中阐述。

1.洋地黄类药物

心律失常(常见室性早搏)、神经精神症状(视觉异常、定向力障碍、昏睡、精神错乱)、胃肠道反应(厌食、恶心、呕吐)。

2.左西孟旦

头痛、低血压、心动过速、胃肠道反应。

3.ARNI

沙库巴曲缬沙坦,可引起低血压、肾功能恶化、高钾血症和血管神经性水肿。

4.伊伐布雷定

光幻视、心动过缓。

5.重组人脑利钠肽

头痛、低血压、心动过速、胃肠道反应。

(四)抗高血压药

主要包括五大类:ACEI、ARB、β受体阻滞剂、CCB、利尿剂,以及由上述药物组成的复方制剂。此外,还包括α受体阻滞剂、中枢性降压药等。

1.ACEI

首剂低血压、咳嗽、高钾血症、肾功能损伤、对妊娠与哺乳的影响、血管神经性水肿。

2.ARB

咳嗽、高钾血症、罕见血管神经性水肿。

3.β受体阻滞剂

心脏毒性:低血压、心动过缓、心力衰竭、撤药综合征;心脏外毒性:诱发或加重哮喘、间歇性跛行、雷诺现象、精神抑郁、乏力、性功能障碍。

4.CCB

颜面潮红、心悸、头痛、眩晕、恶心、便秘、下肢水肿等,维拉帕米和地尔硫有低血压及心功能抑制等。

5.利尿剂

水电解质紊乱、高尿酸血症、耳毒性、糖脂代谢异常。螺内酯久用易引起高血钾,男性乳房女性化、性功能障碍、女性多毛症。

6.α受体阻滞剂

直立性低血压、心悸、胃肠道反应、头晕、头痛。

7.中枢性降压药

包括利血平(鼻充血、抑郁、心动过缓、消化性溃疡等)、可乐定(低血压、口干、嗜睡等)、甲基多巴(肝功能损害、免疫失调等)等。

(五)抗休克药

主要包括血管活性药,涉及肾上腺素、去甲肾上腺素、异丙肾上腺素、间羟胺、多巴胺、多巴酚丁胺等。

抗休克药:心悸、头痛、血压升高、心律失常、胃肠道反应等。

(六)调脂及抗动脉粥样硬化药

主要包括两大类:①主要降低胆固醇的药物,包括他汀类、胆固醇吸收抑制剂、前蛋白转化酶枯草溶菌素9(proprotein convertase subtilisin/kexin type 9,PCSK9)抑制剂及其他类(普罗布考、多廿烷醇等);②主要降低甘油三酯的药物,包括贝特类、烟酸类及高纯度鱼油制剂。

1.他汀类

肝脏、肌肉及血糖相关不良反应。肝脏相关不良反应表现为转氨酶升高;肌肉相关不良反应包括肌酸激酶升高、肌痛、肌炎,罕见横纹肌溶解;血糖相关不良反应表现为血糖代谢异常、新发糖尿病风险。其他不良反应还包括头痛、胃肠道反应、失眠等。

2.胆固醇吸收抑制剂

头痛、胃肠道反应。

3.PCSK9抑制剂

鼻咽炎、流感样症状、注射部位反应等。

4.普罗布考

胃肠道反应、头痛、失眠、皮疹、心律失常等。

5.贝特类

与他汀类药物类似,包括转氨酶升高、肌酸激酶升高、胃肠道反应。

6.烟酸类

颜面潮红、肝脏损害、高尿酸血症、高血糖、棘皮症和胃肠道反应等。

7.高纯度鱼油

胃肠道反应、少见转氨酶或肌酸激酶轻度升高、偶见出血倾向。

(七)抗栓药

主要包括:抗血小板药物、抗凝药物和溶栓药物。

1.抗血小板药物

主要包括阿司匹林、氯吡格雷、替格瑞洛、替罗非班、依替巴肽等。抗血小板药物的主要不良反应为出血。替格瑞洛的其他不良反应包括呼吸困难。

2.抗凝药物

主要包括肝素、低分子肝素、比伐卢定、华法林、新型口服抗凝药(new oral anticoagulants,NOACs)等药物。主要不良反应为出血及血小板减少。华法林的其他不良反应包括皮肤过敏或者皮疹、紫足综合征或蓝趾综合征、骨质疏松和血管钙化等。

3.溶栓药物

主要包括尿激酶、阿替普酶等药物。溶栓药物主要不良反应为出血,极少部分患者对于尿激酶,可能会出现过敏反应。

附录三 心血管病药品有效性评价常用替代指标

1.抗心绞痛药

心绞痛症状改善情况、评分量表;

负荷试验改善情况(包括负荷心电图试验、负荷超声心动图试验和放射性核素负荷试验);

缺血或存活心肌面积变化:心脏磁共振显像、PET/CT心脏显像。

2.抗心律失常药

症状性治疗:改善心律失常患者临床症状;

改善心动过速/心脏不同步所致心功能恶化。

3.抗心力衰竭药

呼吸困难改善程度;

6分钟步行试验心力衰竭体征:肺淤血、肺部啰音、颈静脉压升高、胸腔积液、下肢或足部水肿,以及肝脏淤血增大等;

临床体检指标改善:体重、24小时尿量;

生活质量/整体临床状态;

心功能:左室射血分数、收缩和/或舒张期左室内径、B型利钠肽(Brain Natriuretic Peptide,BNP)/N末端B型利钠肽原(NT-proBNP)、心率、血压等;

肾脏功能:包括血肌酐、尿素氮、肌酐清除率、肾小球滤过率等;

其他客观测量指标:联合用药、氧疗和插管/辅助通气等治疗的改变指标。

4.抗高血压药

血压下降水平及靶器官保护。

血压下降水平:血压绝对下降幅度、血压达标率、谷峰比值(T/P ratio)、平滑指数(SI)、血压变异率等;

靶器官保护评价指标包括:左室肥大、左心室舒张功能和动脉顺应性、肾功能(血肌酐、尿素氮、肌酐清除率、肾小球滤过率等)、眼底病变(视网膜、视网膜动脉、视乳头)、血管病变(血管斑块、硬化、颈动脉内膜中层厚度)。

5.抗休克药

心功能:左室射血分数、收缩和/或舒张期左室内径、B型利钠肽(BNP)/N末端B型利钠肽原(NT-proBNP)、心率、血压等;

肾功能:包括血肌酐、尿素氮、肌酐清除率、肾小球滤过率等;

皮肤温度。

6.调脂及抗动脉粥样硬化药

血脂检测指标下降水平;

血脂达标率;

斑块容积变化(冠状动脉、颈动脉、下肢动脉)。

7.抗栓药

抗血小板药物:血小板抑制率、血小板功能等。

抗凝药物:通过实验室指标测定评价抗凝效果及出血风险。普通肝素:活化部分凝血活酶时间(activated partial thromboplastin time,APTT)、活化凝血时间(activated clotting time,ACT);比伐卢定:活化凝血时间;华法林:国际标准化比值(international normalized ratio,INR)。

溶栓药物:血管再通,判定标准包括直接判定标准和间接判定标准。

第四节 儿童药品临床综合评价技术指南开发研究

一、背景

我国现有0~14岁儿童2.33亿,占全国总人口的16.8%,其健康关系到家庭幸福、社会安定、民族兴盛。随着医药卫生事业发展,儿童健康保障政策不断完善,儿童用药保障能力显著提升,但同时也给国家及地方儿童药品的临床监督管理及合理应用带来了挑战。

我国儿科基本用药长期以来存在严重的供应短缺问题,儿科用药在药品研发、药品生产、招采配送、临床使用、定价与报销、监测与评估等多个环节均存在不同程度的问题。90%的临床基本药品没有儿童专用剂型,临床用药剂量缺乏科学测定机制,临床药品应用不规范,存在大量超说明书用药的行为,同时存在大病用药经济负担重、新兴药品难以快速进入临床使用等问题,难以保障儿童用药安全,不利于儿童健康改善。

党中央、国务院始终高度重视儿童用药保障工作。按照《“健康中国2030”规划纲要》《“十三五”卫生与健康规划》《“十三五”深化医药卫生体制改革规划》对药品临床综合评价工作要求,根据国家卫生健康委《关于开展药品使用监测和临床综合评价工作的通知》工作部署,需要围绕儿童药品临床使用开展科学化、规范化的监测评价,以推动国家儿童基本药物制度建立和完善,提高儿童临床用药的安全性、合理使用水平,加强儿童基本用药保障,引导促进安全、有效、经济、适宜的儿童药品的研发、生产和使用。

基于上述背景,我中心研究团队受国家卫生健康委药政司委托,开展《国家儿童药品临床综合评价技术指南》(以下简称《指南》)开发研究工作,为指导儿童药品临床综合评价工作提供了规范、科学、公开、透明的标准流程及方法工具包。

二、研究目的

基于卫生技术评估方法框架,探索适宜我国的儿童药品临床综合评估机制、流程、方法,形成儿童基本药物临床综合评估指南。

具体目标:

1.结合文献研究及专家咨询,建立我国儿童药品临床综合评估指南初步框架。

2.遴选3~4类药品开展试点评估,基于卫生技术评估开展重点药品试点评估,总结主要机制、流程和方法。

3.通过咨询论证,确定综合评估指南文本。

三、研究设计及方法

总体研究分为三个阶段,即①《指南》基本框架开发阶段;②试点评估阶段;③《指南》文本确定阶段。通过理论与实践的有机结合及统一,探索真正符合我国临床需要的儿科用药综合评估机制和标准的流程方法。

(一)《指南》框架开发

1.文献综述

梳理国内外文献及政策文件,分析我国基本药物制度要求及儿科用药主要问题与挑战,判断综合评估政策导向及具体要求,包括优先选题标准、用药问题分析角度、价值判断维度等,同时结合临床用药综合评估体系建设要求,分析主要评估体系模块,梳理核心机制及建设目标等。

2.专家咨询

建立综合评估框架模型及核心指标集,初步确定综合评估工作的管理要求,界定评估主客体、评估原则、评估维度、核心指标、评估方法、证据产出等技术内容。

(二)试点评估及反馈

通过实践应用前一阶段探索的评估框架、流程及方法,分析具体实施问题,总结实践应用效果及影响,为丰富完善评估指南提出针对性建议。具体为,联合北京儿童医院、复旦大学儿科医院、上海市儿童医院等国家儿童医学临床中心或大型儿童专科医院,以儿童白血病、心血管、消化、变态反应性疾病用药为切入,开展综合评价试点,探索指南应用潜在效果,及时发现问题,为完善指南提供了实证基础。

依托卫生技术评估的基本方法学框架,结合临床药学、循证医学、卫生经济学、公共政策分析等方法,建立综合评估框架模型及核心指标集,利用公立医院临床真实世界数据和文献二手数据,针对遴选出的评估主题开展安全性、有效性、适宜性、经济性、公平可及性分析。基于试点评估情况,梳理总结核心评估机制、过程和方法,重点包括选题机制、评估过程和方法、证据阐释分析标准等,分析主要问题和挑战。

(三)《指南》论证与形成

结合试点情况对儿科药品临床综合评估指南框架进行丰富和完善,并开展专家咨询和论证,形成评估指南文本。《指南》明确了评估工作的管理要求,界定了评估主客体、评估原则、评估维度、核心指标、评估方法、证据产出等技术内容。

四、研究结果

(一)综合评价内容与维度

儿童药品临床综合评价是应用多种方法对多维度、多层次证据的综合过程。评价内容主要是基于临床价值的药品技术评估和药品政策评估两个方面,重点围绕安全性、有效性、经济性、适宜性、创新性、可及性等六个维度进行定性及定量数据整合分析,充分利用大数据、区块链、人工智能等技术,结合患儿分子分型与用药预后相关性研究分析,以及重大疾病基本药物精准使用,形成儿童药品价值判断的综合依据。

1.安全性评价

(1)安全性评价及临床决策:

安全性是儿童药品临床综合评价的核心维度,是判断药品临床价值的基础。除非特定情况,建议所有针对儿童药品的临床综合评价均应开展药品临床使用的安全性评价。

安全性评价是对儿童药品质量及上市前后出现的或可能出现的用药风险进行科学评估的过程。用药风险包括药品不良反应以及与用药有关的不良事件发生风险等。

(2)指标选择:

评价指标应选取儿童药品不良反应发生率,尤其是新的不良反应和严重不良反应的发生率,建议分年龄段了解不良反应发生情况,重点关注新生儿、婴幼儿等低龄儿童。还应关注儿童药品说明书信息的缺失程度,重点考虑儿童用药标识及用法用量信息完整性。

按照可用性、可靠性、相关性等原则,建立特定药品安全性评价的核心维度和指标,并定义数据来源及收集方式,主要包括以下两类:

上市前安全性。上市前安全性是指药品在动物实验之后、进入临床实际应用前所进行的人体相关试验的安全性评价。一般通过收集说明书信息或企业前期研究数据获得,或通过文献综述方法获得。

上市后安全性。上市后安全性是指药品在进入临床实际应用后所进行的安全性评价,通过国内外药监局发布的公告、各省卫生健康部门重点药品监控信息等获取,必要时应分析同类可替代药品的安全性。

(3)安全性测量:

应根据食品药品监督管理部门认定的不良事件与试验用药的相关性评价标准和报告表格收集、分析药品安全性信息,参考相关疾病诊断标准、通用不良事件术语标准5.0版(Common Terminology Criteria for Adverse Events v5.0,CTCAE v5.0),并结合专家意见,合理判断药品安全性。评价证据首选国内药监部门提供的药品质量及不良反应监测结果,其次应获取临床药品使用安全数据,还可综合参考文献的系统评价/Meta分析证据。应充分利用国家药监局、药政部门已有的药品信息系统数据。

(4)同类药物安全性比较:

同类药物安全性比较是指与对照药比较的安全性差异,即不良反应发生率和/或严重程度的差异,重点采用真实世界研究、文献评价等方法,关注严重不良反应的比较。针对真实世界研究建议参考相关指南规范,综合利用医疗机构、疾病登记系统等数据开展研究,全面考察真实世界中药品安全性差异及不同患儿群体的安全性差异等。

2.有效性评价

(1)有效性评价及临床决策:

有效性是儿童药品临床综合评价的核心内容。除非特定情况,建议所有针对儿童药品的临床综合评价均应开展药品临床使用的有效性评价。

有效性评价是药品使用后对患者疾病状况的改善程度进行科学评估的过程,包括疾病的预防、诊断和治疗。鉴于目前在用的多种儿童药品均存在超说明书使用、效果研究证据匮乏等问题,应综合运用文献证据、临床试验数据及临床真实世界数据开展临床用药有效性评价。

(2)指标选择:

依据国家卫生部门及专业学/协会出版的疾病治疗指导原则、指南、规范、共识等,按照简明、可操作、可比等原则,根据主要临床治疗效果、次要临床治疗效果及副作用情况,选择相应结局指标,构建核心指标体系,定义数据来源及收集方式。尽可能采用国内外诊疗规范及指南建议的终点指标。

效果/疗效指标应该选择可获得的最佳证据,即从临床疗效或实际效果指标中选优。对于新药,当随机对照临床试验(RCT)的疗效数据可获得并适用时,优先选择临床疗效数据;对于已上市多年的药品,建议考虑使用真实世界研究中的实际效果数据。

对于实效性临床试验(PCT)和RCT数据的选择,推荐优先考虑基于中国人群开展的大样本、多中心数据或含有中国人群的国际多中心数据。如选择含有中国人群的国际多中心RCT数据,应尽可能地对中国亚组人群的特征进行描述和分析;当无法获得含有中国人群的数据时,可以使用基于其他国家或地区人群的数据,但需要清晰地解释使用这些数据的合理性,强调人群之间潜在的差异,并需要对关键参数进行敏感性分析。

推荐优先选择干预组与对照组头对头直接比较的PCT和RCT数据。当缺少直接比较时,应尽量选择间接比较或网络荟萃分析数据。

3.经济性评价

(1)经济性评价与临床决策:

经济性评价指采取卫生经济学或药物经济学的基本方法,鉴别、测量、比较、分析不同药品治疗方案的成本、效益、效果、效用等,综合判断药品临床投入产出比,衡量其临床使用的经济价值及预算影响。经济性评估实施主要参考现有药物经济学评价指南,主要包括中国药物经济学评价指南、中国药品综合评价指南参考大纲以及国际药物经济学和结果研究协会等发表的系列指南。

(2)临床结果指标选择与测量

1)效果/疗效:

经济性评价中的效果/疗效指标选择应与有效性评价中的效果指标选择保持一致。

2)效用:

建议采用质量调整生命年(QALYs)作为儿童药品效用测量的指标。

推荐优先使用间接测量法测量效用值。建议使用普适性效用量表,如欧洲五维健康量表儿童版(EQ-5D-Y)或儿童生活质量普适量表(PedsQLTM)。当有证据表明普适性效用量表不足以反映某一患病人群重要特征或疾病症状时,可以使用疾病特异性效用量表。

当针对特殊疾病或人群无可用间接测量量表(健康效用量表)时,可采用直接测量法测量效用值。当无法通过测量得到效用值时,可从文献中获取相似问题、相似人群及状态的效用值,但需进行敏感性分析。

3)效益:

效益是指用货币单位量化的健康产出。疾病治疗方案的效益包括直接效益、间接效益和无形效益三个部分。

直接效益指实行某项干预措施后所节省的卫生资源,可以用货币计量直接效益。

间接效益指实行某项干预措施后所增加的患儿的健康时间或劳动生产力恢复带来的收益。推荐使用人力资本法计算间接效益。

无形效益指实行某项干预措施后减轻或者避免患儿身体和精神上的痛苦,以及康复后带来的舒适和愉快等。推荐采用意愿支付法计算无形效益。

4)健康产出贴现:

当待评药品治疗时间超过一年时,应该对发生在未来的健康产出进行贴现。贴现率一般为市场普遍应用的银行利率。本指南建议基础分析中贴现率5%,在敏感度分析中以0~10%的变化进行分析。

5)临床结果外推:

效果外推主要涉及的问题有两个方面,一是在严格的随机对照条件设置下得到的疗效是否能够反映真实世界情况;二是真实世界下得到的效果是否能直接运用到不同的医疗保障制度背景之中。需分析评价纳入的目标人群的特征(人口特征、疾病病情特征、所属地区医疗保障体系特征、文化特点等)与外推人群特征的异同,判断外推的合理性和可行性。

(3)成本指标选择与测量

1)成本定义及分类:

药物治疗成本是指患儿因接受某种药物治疗而消耗的医疗资源和相关非医疗资源。因此,药品治疗成本不仅包括药品费用本身,还包括相关的诊查、随访、照护等临床治疗产生的直接或间接费用。

药物治疗成本可分为直接成本、间接成本和隐性成本,其中直接成本中又包括直接医疗成本和直接非医疗成本。直接医疗成本通常包括门诊费用、住院费用、自购药费用等;直接非医疗成本通常包括交通费、营养费、陪护费等;间接成本指由于疾病、伤残或死亡造成的患儿和其家庭的劳动时间及生产率损失,包括休学、休工、早亡等造成的患儿及家人的经济收入损失等。

2)成本测算的角度:

成本测算的角度与所选定的评价角度一致。一般来说,儿童药品临床综合评价有五个角度,即全社会角度、卫生体系角度、医疗保障支付方角度、医疗机构角度和患者角度。全社会角度下应纳入所有直接医疗成本、直接非医疗成本和间接成本,然而实践中全社会视角的研究结果较难获得;卫生体系角度下应纳入卫生系统内的所有直接医疗成本,当前我国儿童药品的综合评价工作由卫生部门牵头,一般情况下推荐采取卫生体系角度开展成本测算;医疗保障支付方角度下应纳入医保支付范围内的所有直接医疗成本;医疗机构角度下,应纳入本医疗机构承担的直接医疗成本和直接非医疗成本;患者角度下,应纳入患者相关的所有直接医疗成本、直接非医疗成本和间接成本。对于隐性成本,目前尚无成型的测算方法,研究者可以灵活处理。

3)成本测量及测量范围:

成本测量时应首先列出与实施干预措施相关的资源项目,并明确资源项目的计量单位,再根据该计量单位测算消耗的资源数量。计量单位主要包括两类,一是卫生资源消耗的自然单位,二是根据国家相关部门制定的项目标准。成本的计量单位可以是比较宏观的,如一年就诊、一次住院、一次门诊等单位;也可以是比较微观的,如一片药品、一次注射、一次护理等。在数据可得的情况下,应尽可能使用微观的计量单位。

成本测量的范围需要与所确定的研究时限一致,应纳入研究时限内与实施干预措施相关的所有当前的和未来的成本。成本测量的范围还应坚持与临床效果对等原则,要将产生“该类临床效果”对应的所有诊疗活动所产生的成本均纳入成本测量范围。

在基于临床试验的儿童药品临床综合评价中,应当识别并排除为了进行临床试验而发生、但在实际临床治疗中不会发生的“试验成本”。如某些成本项目难以确定在实际临床治疗中是否会发生,可以参考同类非基于临床试验的儿童药品临床综合评价中的成本构成进行敏感性分析。

如果待评药品发生了药品不良反应,则也要计入待评药品成本中。与不良反应相关的成本主要有两类,一是为避免或监测不良反应发生而产生的成本,二是不良反应发生后进行医疗干预而产生的成本。尤其需要关注中度和重度不良反应对成本产生的影响。

对于因疾病治疗所付出的间接成本,也称劳动力成本,建议采用人力资本法进行计算,即假定所有损失的时间用于生产,用劳动力市场平均工资水平去估算因疾病或过早死亡带来的劳动力损失。

4)药品价格:

药品价格是成本测算的基础数据。药品单价建议优先使用官方或权威机构发布的最新价格信息(省级招标采购的中标价、国家谈判价等),其次可选医疗卫生机构或正规经营药店的销售价格。如果某一医疗资源项目在市场上存在多个价格,在市场份额分布已知前提下,可采用市场份额加权的平均价格;在市场份额不可获得时,可采用所有已知价格的中位数。

同一通用名相同剂型不同规格药品的价格可以采用限定日剂量(DDD)进行校正,再进行加权或中位价格的计算;不同剂型的药品如果治疗目标相当,也可以通过DDD方式进行价格转换,然后再计算平均价格。

如果药品尚未在全球上市,建议采用生产厂商建议价格进行分析;如果药品尚未在国内上市,建议采用生产厂商建议价格,同时获取多个国家及地区的国际价格作为参考,确定适宜的价格或价格区间。研究者如未使用上述推荐的价格体系,应该明确注明并解释所使用的其他价格体系的合理性。

5)成本贴现:

当待评药品治疗时间超过一年时,应该对发生在未来的成本进行贴现。建议对成本与健康产出采用相同的贴现率。

6)成本外推:

不同国家和地区之间的医疗资源使用标准和单位成本之间存在较大差异,成本外推时需分析本次评价目标人群所在地区的经济水平、各类相关资源的价格水平与外推地区的异同,判断外推的合理性和可行性。

(4)经济评价分析:

根据评估决策需求,对待评主题进行经济学评价。评价方法主要有成本-效果分析(CEA)、成本-效用分析(CUA)、成本-效益分析(CBA)、最小成本分析(CMA)等4种。在条件允许的情况下优先考虑成本-效用分析。

1)成本-效用分析(CUA):

适用于临床产出指标不同的儿童药品之间的比较分析。通常采用QALYs作为CUA的健康产出指标,既体现治疗方案对患者生存时间的影响,也体现对生命质量的影响,尤其适用儿科慢性病治疗药品的经济性评价。同时应注意,不同的生命质量测量方法、测量工具和效用积分体系均会对效用值产生影响,评价报告应具体阐述效用值的测量方法。

2)成本-效果分析(CEA):

适用于比较相同临床产出的不同治疗方案的评价,通常以生命年、无症状天数、有效率等作为衡量指标,健康产出指标为临床效果指标。当儿科疾病治疗方案的产出指标只体现或主要体现在某一个临床产出指标时,可考虑使用成本-效果分析。当儿童疾病治疗效果有多个测量指标时,应采用对疾病治疗或者对患儿最为重要的效果指标。

3)成本-效益分析(CBA):

CBA的成本和健康产出均采用经济指标衡量,可将健康产出通过支付意愿法或人力资本法等方法转换为货币指标,进而进行净效益计算。在评估中需要解释健康产出转换成货币值采用的所有步骤和方法,并使用敏感性分析验证主要假设。当儿童药品的健康产出难以采用质量调整生命年或其他任何单个效果指标测量时,可采用成本-效益分析。

4)最小成本分析(CMA):

当有证据显示待评价的儿童药品及其对照药品的重要临床产出无统计学差异或无临床差异时,可选择最小成本分析的评价方法。在证明不同儿童药品临床产出的无差异时,统计学无差异和临床无差异均可以接受,当存在公认的临床无差异标准时,以临床无差异为准。

5)增量分析:

CEA和CUA是按照增量分析结果进行决策,在干预药品和对照药品之间进行成本和健康产出两个维度的比较,主要是计算两方案之间的增量成本-效果比(ICER),即成本之差和效果之差的比值。ICER对比支付意愿阈值(WTP),决定干预药品相较于对照药品是否更加经济。

6)不确定性分析:

经济学评价应对主要参数的不确定性进行全面分析。参数的不确定性可以采用单因素、多因素、极值分析法等确定型敏感性分析,也可以采用蒙特卡洛模拟进行概率敏感性分析。常见的不确定性参数有药品价格、治疗效果、转移概率等。每一个不确定性参数的取值范围需要有充分依据,如来源于文献报告的95%可信区间或最大最小值,或同类研究中参数估计的范围等。

7)预算影响分析:

可根据情况,选择是否针对特定药品的经济性开展预算影响分析。

4.适宜性评价

适宜性是衡量儿童药品临床使用情况的重要维度,适宜性评价是指运用药物流行病学等技术手段和统计方法对药品及其临床使用的可利用度进行科学评估的过程。可从药品技术特点适宜性和药品使用适宜性两个层面进行评价。

(1)药品技术特点适宜性:

药品技术特点适宜性可从药品标签标注、药品说明书、储存条件等方面进行评估。主要的指标应包括:标签标注完整性,药品说明书是否明确标注年龄别、体重别或体表面积别剂量标准,剂型和口味是否适宜于儿童服用,是否有特殊的存储条件,是否需要特殊装置,用药后是否需要监测或随访服务等。

(2)药品使用适宜性:

药品使用适宜性评价应考虑以下维度:

1)用途合理性,包括:

是否符合药品说明书范围用药,超药品说明书用药是否有充分理由,用药是否针对适应证,联合用药是否合理,用药是否准确排除禁忌证。

2)给药适宜性,包括:

药品用量是否符合患儿的年龄、体重、体表面积和当时的身体状况,给药途径是否根据患者情况和药物特点来选择,给药时间是否正确。

3)用药适宜性,包括:

患者服药时间间隔是否恰当,用药疗程长短是否符合患者、疾病、药理特点,是否及时完善用药方案,是否符合临床指南规范用药等。

适宜性评价数据主要来源于:①药品说明书;②临床诊治指南;③国内外药品监督管理部门网站上市药品数据,文献及国内正规药品信息网站;④问卷调查或专家意见。

5.创新性评价

创新性评价是指运用技术手段对药品属性满足儿童用药的需求程度进行科学评估的过程。我国儿童药品研发生产动力不足,应通过创新性评价更好地判断药品临床和产业价值,引导临床科研机构、创新产品转移转化平台及医药企业进行研发、转化、生产,支持国家鼓励研发生产儿童药品清单的更新完善,为国家卫生科技创新投入及立项提供方向。

(1)临床创新性:

临床创新性主要聚焦儿童基本用药需求的满足程度,评判指标包括:①药品技术特性是否具备优于其他同类可替代药品的显著技术优势(剂型、口味、给药方式、剂量);②特定药品是否可满足其他临床药品未能满足的健康需求;③药品临床使用是否较大地提高了用药安全性、有效性。

(2)服务创新性:

服务创新性关注药品应用对于卫生服务体系的影响,关键指标包括:①是否优化儿科诊疗服务流程,提升服务预约、利用、随访等活动效率;②是否提高区域或机构儿科诊疗服务资源利用效率,如鼓励以社区为主提供治疗服务,减少医疗及社会资源的消耗;③是否有助于提高患儿及家长的服务感受,包括简化服药要求、减少看护时间等。

(3)产业创新性:

产业创新性关注国产创新及研发生产能力,考虑的核心指标包括:①是否为儿童专用药品(专用剂型规格);②是否为本土研发的原研药或全球首个仿制药;③是否获得国内药品结构或制剂工艺方面的专利;④是否获得美国、日本或欧盟药品结构或制剂工艺方面的专利。

6.可及性评价

可及性评价是指运用药物流行病学及药物经济学方法对药品价格、供应能力等进行综合科学评估的过程。保障儿童用药的临床可及性是国家基本药物制度实施的重要目标。结合WHO和国际健康行动机构(HAI)推荐指标及WHO儿童药品可及性项目调查结果,推荐使用价格、可获得性和可负担性三类指标进行儿童药品临床可及性评价。

(1)药品价格水平:

主要指标可包括:①比较目标药品与同类药品在国内市场的单位价格,可通过国家或省级药品集中采购平台、线上药店等途径获取;②比较国内药品与国际药品价格,可使用中位价格,比较同类药品价格的国内外差异。

(2)可获得性:

可获得性可界定为患儿获得药品潜在机会的大小。因此,上市药品的种类和数量、药品生产与流通企业数量、药品生产厂家生产能力、配送公司配送能力、医院和药店的地理分布、医疗卫生机构的药品配备能力、医疗卫生机构的药品短缺率及其原因等可作为判断药品可获得性的主要指标。例如,①医疗卫生机构药品配备率,通过针对儿童医院、综合医院、基层医疗卫生机构的分层抽样调查获得;②医疗卫生机构基本药品的短缺率及其原因(药品生产企业原因、药品配送公司原因、医院计划原因),通过各级各类机构分层抽样调查获得;③配送企业数量、配送渠道及能力,配送质量及效率等,通过行业协会、医疗机构抽样调查获得。

(3)可负担性:

可负担性指城乡患儿家庭对于药品治疗费用的负担能力情况,《WHO/HAI药物可及性标准化方法》采用家庭灾难性支出概念判断可支付性。结合我国实际,建议指标采用人均年用药治疗费用占城乡居民家庭年可支配收入比重(%)。通过调查结合文献等方式获得有关数据。

(二)评价设计与分析方法

1.评价类型

根据研究时限、数据可得性和研究目的,可将儿童药品临床综合评价分为快速综合评价和完整综合评价两种类型。研究者可根据具体情况选择合适的评价类型。但无论哪种评价类型,其评价方法都可能包含文献分析、试验设计、定性访谈、模型研究等四个方面。

(1)快速综合评价:

当研究时限紧迫或二手证据资料较为充分时,通常采用快速综合评价法评价目标药品。

1)基于文献快速综合评价:

根据评价问题、研究人员数量及时间要求,可分为系统性文献综述和选择性文献综述两种,前者比后者需要的人财物资源更大,适合在文献资源较多、证据等级较高的条件下实施。

系统性文献综述利用循证医学及证据质量评估等方法工具,对国内外临床研究文献证据进行综合评估,基于证据质量及推荐强弱程度,报告临床安全性、有效性或经济性文献评估结果。推荐使用Cochrane协作网有关系统评价方法及工具,必要时应对临床研究文献证据进行Meta分析。

选择性文献综述适用于目的较为明确的信息检索,如检索政府、行业协会及国际组织网站查找特定证据或信息。

2)基于专家咨询/问卷的快速综合评价:

针对不同品牌、规格、剂型的同类药品的特点分析(质量、顺应性、可及性、合理用药等),可采取基于专家或问卷调研的快速评估,集合有关信息,采取层次分析法构建指标体系,进行具体药品间比较分析,支持快速评价的开展。

(2)完整综合评价:

当研究时限允许时,可选择完整综合评价法评价目标药品,提高研究结果的可信度。

完整综合评价通常包含临床试验设计,建议根据流行病学、卫生统计学、卫生技术评估的标准评价流程及方法进行研究设计。建议在必要时采用多中心临床研究方法,在更大的范围内收集病例资料,提升儿童药品临床综合评价结果的代表性和可信度,保证研究质量。

针对安全有效性评估,应采取二手证据(文献分析等)与一手证据(临床试验研究、定性访谈等)分析相结合方式开展,基于二手证据评估结果,确定一手证据评估需求,定义评估问题及关键指标,建立基于临床一手数据分析的评估方案;针对经济性评估,建议结合临床现实数据进行成本(费用)等分析,必要时可根据文献参数等建立远期成本-效果分析模型或预算影响分析模型。具体流行病学和卫生统计学方法可参考全国高等学校统编教材、卫生技术评估方法可参考陈洁等编撰的卫生技术评估教材。

2.评价原则与步骤

评价步骤是完整的待评问题解决方案的实施流程。根据决策问题,综合评估可分为技术性评估和政策性评估。

针对政策性评估设计,研究设计可根据回答问题类型选择常规的形成性评价(formative evaluation)或总结性评价(summative evaluation)设计,针对政策实施过程、结果或影响进行评价,也可以采取现实性评价(realist evaluation)及发展性评价(developmental evaluation)等方法对于政策或项目理论本身进行深入分析研究,建议参考国内外经典卫生项目或公共政策评价教材进行评价设计。推荐应用WHO建立的基本药物政策评价工具和方法。

针对技术性评估设计,研究设计的内容包括确定拟解决的决策问题、评价角度、药物治疗的干预和对照、研究人群、评价的维度和测量指标、评价方法和数据来源,以及评价计划和时间安排。以下将重点介绍技术评估内容。

(1)评价背景:

评价背景类似于缩略版综述,其核心是阐述立题依据。需提供的信息主要包括待评药品相关适应证的疾病流行病学概况、医疗服务利用情况、经济负担情况、主要干预措施(如国内外临床诊疗指南对治疗方案的推荐,包括药物与非药物)、全球范围内相关干预措施的有效性、安全性和经济性等的评价现状、临床上或政策上存在的主要问题、待评药品的优势,以及本研究的价值(必要性和重要性)等。

(2)评价目的:

明确提出本次儿童药品临床综合评价的主要目的和待解决的问题。评价目的中应简明扼要地阐述“运用何种理论和方法,解决何种主要问题,达到何种主要目的”。评价目的要与评价背景所阐述的问题相互呼应。

(3)评价角度:

研究者应根据研究目的和报告对象明确评价角度。评价角度主要包括以下几类:全社会角度、卫生体系角度、医疗保障支付方角度、医疗机构角度以及患者角度。

推荐采用卫生体系角度进行评价。对于外部性极强的儿童药品,在数据可获得条件下,其临床综合评价可考虑全社会角度的评价。对于其他应用领域,研究者可根据评价目的选择合适的评价角度。

在一项儿童药品临床综合评价中,可以分别基于多种角度开展评价,但各角度应保持前后一致性。

(4)目标人群:

评价需要明确待评药品的目标人群以及纳入标准与排除标准。一般情况下,儿童药品临床综合评价的目标人群应与药物的适用证人群一致。应采用流行病学特征描述目标人群的患者类型,如年龄、性别、疾病类型与严重程度、有无其他合并症或危险因素、社会经济特征等。

应采用国际疾病分类编码(ICD-11或机构通用的编码)界定适应证。当目标人群存在较大的异质性时,可以根据研究需要开展亚组分析,如根据人口特征、疾病亚型、严重程度和合并症进行分层分析。

纳入标准与排除标准可能使得临床试验人群与真实世界用药人群存在差异。当临床试验人群与真实世界用药人群有差异时,评价应进一步探索不同人群的差异对评价结果造成的影响。

(5)干预及对照措施:

待评药品(干预措施)和对照药品(对照措施)的描述应该包括剂型、规格、用法用量、给药方式、合并用药和治疗史等信息。待评药品和对照药品应以通用名表示,同时列出商品名。

对照药品的选择建议尽可能采用相同适应证的标准治疗方案。如果没有标准治疗方案,可以考虑临床上的常规治疗方案。如果某些疾病目前仍然没有有效医疗措施或不建议干预,可以与安慰剂(即无干预)进行比较,但须说明其无医药干预的临床合理性。

如果待评药品属于现存的治疗药物分类,原则上选择同一治疗分类中的标准治疗或最常用的药物作为对照;如果药物属于一个新的治疗药物分类,且适应证与其他药物相同或相近,则选择适应证相同或最相近的药物作为对照;如果评价目的是将待评药品纳入基本药物目录,则需考虑以目录中已有的替代药品作为对照;如果待评药品属于中药或中成药(非辅助治疗),建议纳入与其适应证相同或相近的西药进行对比,同时也可考虑功能主治相同的中药品种;如果临床研究为单臂研究,可考虑使用真实世界的标准治疗方案作为对照。

标准治疗或最常用治疗的选择可参考国内外循证诊治指南所提供的标准治疗或常规治疗方案,同时应充分征求权威临床专家的专业意见。

根据评价目的,可选择一个或若干个对照药品。

(6)评价维度及指标选择:

评价维度是评价设计的核心内容,常用评价维度包括:安全性、有效性、经济性、创新性、适宜性、可及性及药物政策评价维度。应针对决策问题,选择确定具体纳入评价的维度(表1-1-12)。

表1-1-12 综合评价维度、方法及数据来源

(7)研究方法选择:

儿童药品临床综合评价采用定性定量结合的方法,收集一手和二手证据进行分析。对安全性、有效性和经济性进行评价时,首先采取系统文献综述收集和/或二手证据分析,若仍未满足评价的需求,应该增加一手资料的研究。进行一手证据收集时,应首选基于医院病例数据的真实世界数据研究,尤其是回顾性研究。历史数据若未能满足需求时,可开展前瞻的观察性研究或干预性研究(临床试验研究)。图1-1-26是研究设计路径图。

3.文献分析

文献分析可以采用系统评价/Meta分析的方法,若同时比较多种干预措施,建议采用网状Meta分析方法;针对已经有同一主题多个相关系统评价/Meta分析发表,开展系统评价再评价,并进行二次分析。

(1)证据收集要求:

建议参照Cochrane干预措施评价手册的PICO原则,提出明确、可解答的临床问题;并根据问题来源,分为诊断、病因、治疗、预后、预防及不良反应等类型。每类问题都有其相应的最佳证据和证据分级。应将待评药品与常规治疗方案比较,以体现待评药品与常规治疗方案的比较优势和劣势。

(2)检索文献资源

1)检索资源与检索方法

① 资源范围:应充分考虑以下文献资源检索范围:a.综合性文献数据库资源,如PubMed/MEDLINE、EMBASE、Cochrane Library、Web of Science和中国生物医学文献数据库(CBM)等;b.与研究课题相关的专题数据库;c.研究检索,如WHO国际临床试验注册平台等;d.会议论文与学位论文,中国知网、万方数据库、国家科技图书文献中心等;e.手工检索未被电子数据库收录(数据库收录时间以外)期刊,手检期刊的种类和数量视电子数据库纳入期刊数量而定,如纳入研究、综述、系统评价/Meta分析;⑥其他:已发表系统评价/Meta分析、相关网站等。

图1-1-26 研究设计路径图

② 检索途径:推荐使用主题词检索与自由词检索相结合的方式进行检索,并使用逻辑运算符“OR”将主题词检索结果与自由词检索结果连接。

③ 检索策略:应详细报告系统评价中每个数据库的检索策略。考虑到实际操作中信息资源和时间的限制,建议至少报告两种核心电子资源的检索策略。检索策略至少包括研究对象、干预措施和研究设计。

④ 文献筛选:至少两名评价员独立进行,可降低相关文献的误排率,若有意见分歧可讨论解决,必要时需与第三位评价员讨论协商确定。如果可能,应对评价员培训并进行预试验,即对样本文献(10~20篇,其中包括肯定合格的、肯定不合格的和不确定的)预筛选,以保证文献筛选过程的标准化和筛选结果的准确性。文献的遴选步骤参照Cochrane干预措施评价手册。

⑤ 资料提取:为了保证资料提取的准确性,要求两位评价人员各自独立地提取资料,然后互相复核,若有意见分歧可讨论解决,必要时需与第三位评价员协商确定,确保准确无误和意见统一后再输入统计软件。

⑥ 二次重复检索:当证据检索周期较长时,应在生成报告时再次按原有检索策略对证据资源进行检索,以期发现最新发表的、具有重大意义的研究证据。对于新发现的有价值的研究证据,应尽量纳入分析与报告。

2)证据等级评价:

证据的定义。证据是最接近事实本身的一种信息,其形式取决于具体情况,高质量、方法恰当的研究是最佳证据。由于研究本身常常不充分、自相矛盾或不可用,其他种类的信息就成为必要补充或替代。

① 证据质量分级:临床效果证据综合的核心内容之一是对证据总体的质量进行分级,从而为专家委员会在此基础上作出推荐提供依据。可采用推荐分级的评估、制定与评价工作组方法(GRADE)工具或纽卡斯尔-渥太华量表(the Newcastle-Ottawa Scale,NOS)等文献质量评估工具对证据质量进行分析评估。

② 证据质量评价:对基于系统评价的证据质量进行评价包括两个方面的内容,一是对纳入系统评价的单个研究的偏倚风险评估,二是对总体证据的质量分级。偏倚风险评估因针对不同临床问题如治疗、病因、诊断和预后的系统评价所纳入的单个原始研究的设计类型和实施方法不相同,其质量评价工具和方法也不尽相同,具体方法参照Cochrane干预措施评价手册。

(3)分析方法

1)偏倚风险评估:

原始研究的质量直接影响到系统评价/Meta结果和结论的真实性和可靠性,应对纳入的每个研究进行偏倚风险评估。针对不同临床问题如治疗、病因、诊断和预后的系统评价,应结合纳入研究的设计类型和实施方法,选择不同的质量评价方法和工具。

由于系统综述,尤其是Meta分析,是对原各研究成果的统计合成,它不仅不能排除原始研究中存在的偏倚,而且如果在文献查找和选择过程中处理不当,还会引入新的偏倚,导致合并后的结果歪曲了真实的情况。偏倚的种类除了所纳入研究自身所带偏倚外,还包括发表偏倚、定位偏倚、引用偏倚、多次发表偏倚和有偏倚的入选标准等。检查以上偏倚可采用先根据一个基本的入选标准收集全部研究,再考虑不同的入选标准进行彻底的敏感性分析,这是检查偏倚的最佳途径。

在对系统评价中纳入研究的偏倚风险进行评估时,推荐参考使用Cochrane随机对照试验偏倚风险工具和Cochrane非随机干预研究偏倚风险工具。

2)数据分析:

图1-1-27呈现了临床证据系统评价数据分析路径。在数据分析过程中,应该注意:①效应量选择:对于二分类资料,可以选择比值比(OR)、相对危险度(RR)和率差(RD)等作为效应量;对于连续型资料,可以选择均数差(MD)/权重均数差(WMD)和标准化均数差(SMD);对于等级资料,在实际分析中,较长的分类等级资料被处理成连续性变量,较短的分类等级资料被处理成二分类变量进行分析;对于计次资料,稀有事件计次资料分析可使用率,多发事件计次资料常与连续性资料处理方法相同。②异质性的来源与处理(图1-1-28):异质性分为临床异质性、方法学异质性和统计学异质性。在实施数据合并前,首先应分析和识别纳入研究的临床和方法学异质性,只有临床和方法学特征具有足够相似性方可进行合并。针对异质性的处理,可参考提供的流程进行处理。③统计模型选择:统计模型分为固定效应模型和随机效应模型。在临床和方法学同质的情况下,只要具有统计学同质性的资料就可使用固定效应模型进行合并;反之,凡具有统计学异质性的资料则应采用随机效应模型进行合并。随机效应模型是用以处理具有统计学异质性资料的一种统计模型,但不能消除研究间的变异。

撰写系统综述/Meta分析报告时应有文献纳入的流程图并应按报告规范进行。观察性研究有MOOSE规范,随机对照研究有QUOROM规范。

图1-1-27 临床证据系统评价数据分析方案

图1-1-28 异质性检验及相关分析的流程图

4.临床随机对照试验(RCT)

(1)定义:

临床随机对照试验(RCT)采用随机的方法,将合格的研究对象分配到试验组和对照组,接受相应的干预措施。在相同的条件下,同步地观察试验的效应,采用客观的效应指标衡量试验结果。它具有能够最大程度地避免临床试验设计和实施中可能出现的各种偏倚、平衡混杂因素、提高统计学检验的有效性等诸多优点,被公认为是评价临床用药安全性和有效性的金标准。

(2)适用范围:

RCT主要用于揭示在试验状态下患儿用药的效力,通常用于药品上市前的临床试验研究。由于该类研究通常设定严格的入组条件和用药要求,因此具有良好的内部效力,但同时限制了研究结果的外推。

(3)研究设计:

设计过程需遵照以下基本流程:

1)明确研究目的和研究对象;

2)确立对照组;

3)确定样本量、分组方法和抽样方法;

4)确定盲法实施方法;

5)指标测量方法和计算方法;

6)临床结果评价标准;

7)确定统计分析方法;

8)对失访的处理方法和分析方法。

(4)关键问题:

设计实施儿童人群RCT研究时应充分考虑以下问题:

1)严格的“知情同意”可能会导致受试者招募困难,影响样本获得;

2)正确选取对照药品,提升研究效力。如对照药品的确立应为除研究药品外的、同一治疗领域市场用量最大、临床公认安全有效的药品;

3)正确选取安慰剂,避免可能出现的伦理问题;

4)正确使用随机方法,避免选择偏倚;

5)正确选择盲法方法,避免选择偏倚、执行偏倚、观察偏倚;

6)RCT研究耗时长、人财物资源需求量大,应在充分衡量必要性基础上启动RCT研究。

(5)数据收集:

临床随机对照试验数据主要来源于患儿临床诊疗病历记录,如注册登记数据库等。

RCT设计的具体方法参见全国高等院校流行病学和卫生统计学统编教材。

5.实效性临床试验(PCT)

(1)定义:

实效性临床随机试验研究是在实际的医疗环境下,对医疗干预及其最终结果的评估。是在真实临床医疗环境下,采用随机(非必需)、对照的方式,比较不同干预措施的治疗结果(包括实际效果、安全性、成本等)的研究。与传统RCT相比,PCT的典型特征在于:研究在真实的临床医疗环境条件下进行,可根据患者病情和意愿,非随机地进行分组及选择适宜治疗措施。因此,此类研究的结果更贴近临床医疗实际,具有较高的外部有效性,可更好地为医疗决策提供科学依据,帮助利益相关者在现有不同的干预措施中作出最佳选择。

(2)适用范围:

实效性临床随机试验研究主要用于评价在实际临床医疗条件下的药物有效性、安全性和经济性,是药品上市后临床评价研究的最佳选择。

(3)研究设计:

设计过程需遵照以下基本流程:

1)明确研究目的和研究对象;

2)确立对照组;

3)确定样本量、分组方法和抽样方法;

4)确定盲法实施方法;

5)指标测量方法和计算方法;

6)临床结果评价标准;

7)确定统计分析方法;

8)对失访的处理方法和分析方法。

为保障研究结果贴近临床实际,PCT的主要统计分析需要基于意向性分析,即参与分组的研究对象,无论其是否能按照该组原试验计划进行治疗,最终都应纳入所分配的组中进行统计分析。

(4)关键问题。

1)试验对象纳排标准:

PCT研究对象应尽可能与真实医疗环境中使用该干预措施的群体相近,即能准确反映临床实践中患者的疾病严重程度、合并症、年龄、依从性、合并用药等系列特征。因此PCT的纳入标准较宽泛、排除标准较少,允许不同研究对象间存在临床异质性。

2)实施灵活性:

PCT需确保它可以在临床实践中合理推广,包括不必事先对医护人员进行大量额外培训或购置特殊仪器。

3)干预措施选择:

在实际医疗环境下,面临多种可供选择的治疗方案,而PCT又允许干预措施(干预组和对照组)具有高度灵活性,因此常规的随机化方法可能无法实现。

4)对照措施选择:

通常为临床常规或最佳治疗方案,较少选用安慰剂,同样可根据患者状况进行调整。

应严格遵照《药物临床试验质量管理规范》(国家食品药品监督管理局令第3号)的要求,参考药物临床试验、药物临床试验与GCP实用指南、真实世界研究指南等国内出版物,进行药物临床试验设计。

6.横断面研究

(1)定义:

调查研究对象(患儿、药品、厂商等)中特征变量(疾病、不良反应、价格、医疗费用、用药需求等)的存量水平及其分布。还可进一步比较分析暴露与非暴露组的患病情况或患病组与非患病组的暴露情况。

(2)适用范围:

横断面研究主要用于描述研究对象中的特征变量在时间、地区和人群的分布情况。通过收集特定疾病的药品治疗疗效、不良反应、用药人群特点、用药需求、用药保障、治疗成本、治疗费用、合理用药等相关数据,为安全性、有效性、经济性、可及性评价以及预算影响分析提供基础数据参数。

(3)研究设计:

设计过程需遵照以下基本流程:

1)明确研究目的和研究对象;

2)如有必要,确立对照组;

3)确定样本量、分组方法和抽样方法;

4)指标测量方法和计算方法;

5)临床结果评价标准;

6)确定统计分析方法;

7)对无应答的处理方法。

分析资料时,应先仔细检查这些原始资料的完整性和准确性,填补缺、漏项,对重复的予以删除,对错误的予以纠正;对目标特征变量(如疾病、健康状态等)按已明确规定好的标准进行分类、核实,然后可按不同空间、时间以及人群中的分布进行描述。

(4)关键问题

偏倚:常见的偏倚有主观偏倚、无应答偏倚、幸存者偏倚、回忆偏倚、调查偏倚、测量偏倚。偏倚可通过以下方法进行控制:

① 严格遵照抽样方法的要求,确保抽样过程中随机化原则的实施;

② 提高研究对象的依从性和受检率;

③ 正确选择测量工具和检测方法,包括调查表的编制、明确诊断标准且保持标准的一致性等;

④ 组织好研究工作,调查员一定要经过培训,统一标准和认识;

⑤ 做好资料的复查、复核等工作;

⑥ 选择正确的统计分析方法,注意辨析混杂因素及其影响。

横断面研究设计的具体方法参见全国高等院校流行病学和卫生统计学统编教材。

7.队列研究

(1)回顾性队列研究

1)定义:

回顾性队列研究的研究对象是根据其在过去某时点的暴露情况(如用药与否)而入选并分组的,然后从已有的记录中追溯从那时开始到其后某一时点或直到研究当时为止这一期间内,每一成员的发病(或疗效、不良反应等)情况。

2)适用范围:

回顾性队列研究主要用于揭示暴露因素(如用药与否)与疾病(或疗效、不良反应等)之间有无关联及关联程度。

3)研究设计:

设计过程需遵照以下基本流程:

① 明确研究目的和研究对象;

② 如有必要,确立对照组;

③ 确定样本量、分组方法和抽样方法;

④ 指标测量方法和计算方法;

⑤ 临床结果评价标准;

⑥ 确定统计分析方法。

在进行资料分析时,如具备多个时间节点数据,可选择间断时间序列分析(ITS)进行效果趋势变化情况分析;而在非随机分组条件下,可选择倍差法(DiD)处理,并用倾向性得分匹配法(PSM)控制混杂因素。

4)关键问题。

① 基线数据缺失:针对基线资料不全的缺陷,在设计课题阶段可采用限制方法,即设立纳入和排除标准,把关键资料缺失的病例排除。如果排除的病例较多,则需进行缺失数据模式分析,如为随机缺失,删去缺失病例对结果的影响较小。也可比较纳入对象和剔除对象的基线临床特征,如无临床特征显著差异,则说明纳入病例的代表性较好,可以代表总体病例。

② 失访:回顾性队列研究存在失访是不可避免的,一般要求失访率控制在10%之内,最多不能超过20%,否则会存在选择性偏倚,影响结果,故应尽量控制失访。

③ 偏倚:主要是年代偏倚、选择偏倚、失访偏倚、信息偏倚。因此,建议首选起始队列进行研究,其次是横切队列。其他控制偏倚手段同上。

④ 混杂:对照组除暴露因素(如用药与否)外,其他特征(如年龄、性别、职业、文化程度等)应尽可能地与暴露组相同。

(2)前瞻性队列研究

1)定义:

前瞻性队列研究是以现在为起点追踪到将来的研究方法,基于对某种健康结果的病因或者风险因素的假说,通过对研究对象的追踪,观察暴露组与非暴露组健康结局的发生情况,进而建立暴露因素和健康结局的联系。

2)适用范围:

同回顾性队列研究。

3)研究设计:

设计过程需遵照以下基本流程:

① 明确研究目的和研究对象;

② 如有必要,确立对照组;

③ 确定样本量、分组方法和抽样方法;

④ 确定盲法实施方法;

⑤ 指标测量方法和计算方法;

⑥ 临床结果评价标准;

⑦ 确定统计分析方法;

⑧ 对失访的处理方法和分析方法。

4)关键问题

① 应有明确的检验假设,检验的因素必须找准;

② 所研究疾病发生率或死亡率较高,通常不低于5‰;

③ 研究样本纳入排出条件设置的深度和广度保持平衡;

④ 应明确规定暴露因素,并且应有把握获得观察人群的暴露资料;

⑤ 应明确规定结局变量,并且要有获取结局的简便而可靠的手段;

⑥ 应有把握获得足够的观察人群,并将其清楚的分成暴露组和非暴露组;

⑦ 大部分观察人群应能被长期随访下去,并获得可靠完整的资料;

⑧ 应有足够的人力、财力和物力支持该项工作;

⑨ 失访问题同“回顾性队列研究”。

队列设计的具体方法参见全国高等院校流行病学和卫生统计学统编教材。

8.典型案例

典型案例分析方法是对有代表性的事物(现象)深入地进行周密而仔细的研究,从而获得总体认识的一种科学分析方法。

其具体分析步骤为:

(1)依据分析目的,选择有代表性的事件/地区/人群作为分析研究对象;

(2)全面收集有关被选对象的资料,包括直接资料和间接资料,可以收集他人对该对象所研究的间接资料,但是主要收集的是第一手资料,包括事件参与者亲自写的实验记录、学术报告及笔记等,尤其重视收集系统的数据资料;

(3)系统地整理收集到的资料,依据分析研究的项目和内容进行分类;

(4)对所要求分析的内容(如特征、属性、关系等)进行逐项分析研究;

(5)对各项分析结果进行综合分析,探求反映总体的规律性认识。该法既可被用来为某种假说作论证,又可把得到的研究成果作为进行更广泛研究的基础。在从个别到一般或从一般到个别的认识过程中均能发挥作用。

在实际研究工作中,该方法常与其他研究方法结合起来使用。

9.关键知情人访谈

关键知情人访谈是常用的定性访谈方法,一般需要确定访谈对象,并根据对象特点设计半结构化访谈提纲,访谈过程中做访谈记录,并整理访谈内容,形成文字材料,从而获得定性数据。访谈基本步骤包括以下内容:

(1)通过文献检索确定访谈问题;

(2)通过抽样或筛选的方式逐层选择访谈对象;

(3)制定访谈指南和访谈问题提纲;

(4)通过专题小组讨论、关键知情人访谈等方法收集定性资料;

(5)分析资料,并进行效度和信度检测。

资料分析整理。可应用主题综合法,主要包括标记和分类原文的信息和观点,再对标记和分类进行反复讨论,发现其间的异同点和联系,最后将原始研究中多样的信息和观点归纳为系统的几个主题。

10.一般咨询会议

一般咨询会议是定性获得专家意见的常用方式。常适用于对综合评价方案设计的讨论。

(1)咨询对象:

行业内权威专家。

(2)咨询方式:

面对面座谈讨论。

(3)实施流程

1)建立主题:主题定义清晰,涉及问题方面不宜太多,应尽量符合专家背景和水平范围,确保专家理解待咨询内容的角度趋同;

2)组织与会专家发表意见并进行充分讨论;

3)达成共识,取得较一致的结论。

11.焦点小组座谈

焦点小组座谈法是采用小型座谈会的形式,由一个经过训练的主持人以一种无结构、自然的形式与一个小组的具有代表性的评价相关利益团体或个人交谈,从而获得对有关问题的深入了解。该方法的主要作用在于探知未知研究问题、评价中的潜在风险,收集研究主题的一般背景信息并形成研究假设,了解团体访谈参加人对特定现象或问题的看法和态度,为分析大规模的定量调查提供补充分析材料。焦点小组座谈法的实施程序可分为以下五步:

(1)征选参与者:

征选时应极力避免在小组中出现重复的受访者。一个小组一般包括8名参与者。但并不存在理想的参与人数,这应根据小组的类型而定,经历性的小组比分析性的小组所需的受访者要多。

(2)选择主持人:

焦点小组对主持人的要求是:第一,主持人必须能恰当的组织一个小组;第二,主持人必须具有良好的沟通技巧和专业知识,以便有效互动。

(3)编制讨论提纲:

编制讨论提纲一般采用团队协作法。讨论指南要保证按一定顺序逐一讨论所有突出的话题。讨论提纲是一份关于小组会中所要涉及的话题概要。

(4)座谈:

一般包括三个阶段:第一阶段建立友好关系、解释小组中的规则,并提出讨论的个体;第二阶段是由主持人激发深入的讨论;第三阶段是总结重要的结论,衡量信任和承诺的限度。

(5)编写访谈报告:

正式的报告开头通常解释调研目的,申明所调查的主要问题,描述小组参与者的个人情况,并说明征选参与者的过程。然后,总结调研发现并提出建议。

12.德尔菲法

德尔菲法是一种主观评价方法,指书面形式背对背地分轮征求和汇总专家意见,通过中间人或协调员把第一轮调查过程中专家们各自提出的意见集中起来加以归纳后反馈给他们。

德尔菲法的实施程序可分为以下五步:

(1)遴选适宜数量和专业背景的专家,建立专家组;

(2)向专家组发出第一份初始调查表,收集参与者对于某一话题的观点;

(3)向专家组发出第二份调查表,应列有其他人意见,要求其根据若干具体标准对其他人的观点进行评估;

(4)向专家组发出第三份调查表,应列出第二份调查表得出的评价结果和所有共识,要求其修改其原先的评价观点;

(5)总结出第四份调查表,应包括所有评价、共识和遗留问题,由评价团队对其综合处理。

在进行分析时,建议包括专家代表性分析、专家积极程度分析、权威程度分析、意见协调程度分析和意见集中程度分析。

13.模型研究

(1)药物经济学模型:

药物经济学评价模型通常是采用图形结构、公式等方式对疾病的自然转归过程和药品治疗干预对该疾病转归过程的影响以及相关医药消费进行抽象模拟。

模型分析基本步骤为分析明确决策问题、研究设计、构建模型、识别和综合证据、模型分析、处理不确定性和异质性。其中,决策问题和研究设计如前所述,模型分析的具体方法可参考相关技术指南,如国际药物经济学和结果研究协会(ISPOR)发表的关于模型分析的系列指南。以下对可能影响到模型质量的若干主要问题作如下说明:

1)模型类型选择:

需要明确说明使用的分析模型类型。常用的决策分析模型有决策树模型和马尔科夫模型。一般来说,决策树模型适用于时间短,无反复发生的疾病或健康状态的疾病的模拟(如骨折患者的治疗),而马尔科夫模型适用于时间长,反复发生的病情和健康状态的疾病的模拟。根据需要可以两种模型结合使用。

2)模型假设:

明确说明模型中的各状态之间的因果关系、模型结构、模型使用的外推技术、模型适用范围以及模型使用的参数来源,并证明其合理性。对于重要的假设,应当进行不确定性分析。

3)模型结构:

模型的结构应该能够反映疾病的自然转归和干预后的转归变化,并与决策问题相适应。建议使用模型结构图展示模型结构。

4)模型参数:

模型参数应通过系统的方法收集,并说明收集过程和来源。对于关键的效果参数应尽可能来源于系统文献综述,优先考虑国内研究;成本参数应来源于国内研究。以马尔科夫模型为例,模型的参数主要包括四大类:转移概率、成本参数、效果参数和效用参数。参数的数据来源包括:文献、成本测算研究和费用调查、真实世界数据研究(队列研究)和专家咨询等。

5)模型分析:

计算每个治疗方案的单位成本、单位效果/效用。计算增量成本-效果比(ICER)和增量成本-效用比(ICUR)。参数的不确定性可通过单因素敏感度分析和多因素敏感度分析处理。此外,当模型纳入的样本人群具有较大异质性时(如地区差异、文化差异等),要依据研究目的进行亚组分析。

6)模型验证:

研究者应当对所构建的药物经济学评价模型进行验证,包括表面效度、内部效度、交叉效度、外部效度和预测效度等。

所有模型都应对表面效度进行验证,包括对模型模拟的具体问题、结构、参数和结果进行专家意见的验证。所有模型都应对内部效度进行验证,以确保每一个参数的来源、参数估计方法和参数设定正确、合理,每一个公式或程序代码编写完整、正确、合理。所有模型都应进行外部效度验证,研究者应当尽可能选择最合适的数据来源进行外部效度验证,并说明所选择数据的理由。

(2)预算影响分析模型:

预算影响分析(BIA)旨在判断某个儿童药品入市、临床使用或扩大应用对于患者、医院、医保及卫生财政的经济影响。BIA测算时间区间一般为3~5年。

BIA基本流程包括:

1)结合临床实际用药情况,建立BIA模型;

2)通过文献检索、试点机构调查和医护人员等知情人访谈等方式,建立参数表。主要的参数应包括:疾病负担、患者治疗情况、收费报销等背景参数;

3)模拟药品替代或扩大应用后的不同情景,分析对于公共预算、医院运行成本、医保支出、患者费用负担的影响。

(三)数据来源

儿童药品综合评价工作均需要大量数据支撑。使用数据时,应对数据及其来源进行评价,应两位独立研究者独立评价。

1.基本原则

(1)涉及专业内容的文献必须是专业文献,不宜引用报纸、新闻等资料。

(2)药物作用机制、联合用药药物的交互作用等表述应并且仅能引用药品说明书,不得直接引用综述等二手文献。

(3)引用诸如发病率等流行病学数据或有效率等临床效果数据时,必须引用一手文献资料,不得引用二手文献资料。可以依照二手文献提示,查阅到一手文献。

(4)引用成本、费用或价格等数据要注意时效性,通常需限制在最近五年之内。

(5)关于用药临床建议、专家建议等经验性数据信息,可以引用诊疗规范、指南、专家共识等二手文献。

(6)其他类型的数据信息,尤其商业数据库提供的综述数据,需要特别注明,并经过其他专家认可,方可引用。

2.数据来源

(1)国家大型数据库

1)药品注册登记相关数据:

中国药品注册数据库,涵盖了至目前为止所有在国内批准注册上市的药品,可查询国家药品监管部门批准的所有国产药品和进口药品数据,包括已注销或撤销的国产药品与进口药品。

2)药物不良反应监测数据:

国家及各省、直辖市药品不良反应监测中心定期、不定期发布的国家药品不良反应监测报告。

3)基本药物数据库:

充分利用基本药物现有数据库资源,获得患儿基本药品临床使用情况等方面的信息。

4)医疗保险数据库:

充分利用基本医疗保险及商业保险现有数据库资源,获得患儿发病、药品份额、资源应用、经济保障及负担等信息。

5)药品供销及采购数据库:

通过商务、工信、采购等部门关于药品生产、流通、销售、招标、采购等数据库,获取药品作为商品在市场制造、流通及供销信息。

6)其他主要数据库:

应充分检索并利用可得的其他人口健康数据信息,包括出生死亡登记数据、专病登记数据(如传染病报告系统等)、标准化专病数据集、电子健康档案数据及国家自然人群队列数据等。

(2)医疗卫生机构数据:

各级各类医疗卫生机构存储了大量临床用药相关数据,包括医院运行数据和临床专业数据。医院运行数据包括医院业务收支数据、药品和耗材采购和使用数据、价格监测数据;临床专业数据包括电子病历数据、疾病注册登记数据、影像/病理/检查化验数据、医疗质量控制数据等。

(3)临床用药监测数据:

依托国家和省级两级药品使用监测平台和国家、省、地市、县四级药品使用监测网络以公立医疗卫生服务机构为核心,汇总各类现有药品相关数据,包括用药需求、保障、安全、效果和费用信息,系统、综合、动态地应用于常规用药监测、主题遴选及综合评价中。

(4)文献数据:

文献检索范围应至少包括以下3个数据库:PubMed/MEDLINE、EMbase、Cochrane Library。一般情况下,应至少检索一个国内大型文献数据库,如中国知网(CNKI)、维普(VIP)、中国生物医学文献数据库(CBM)、万方(Wanfang)等,和至少一个国外大型文献数据库,如PubMed/MEDLINE、EMbase、Web of Science等。

(四)结果报告

在药品技术评估和政策评估基础上,结合评估设计严谨性、评估指标选择准确性、数据来源与质量可信性、分析方法可靠性等形成儿童药品临床综合评价初步结论及建议,按照国家评估中心提供的标准化评估报告模板撰写报告,提交评审委员会进行会商审议。

(五)质量控制方法

1.总体质量控制

国家评估中心建立儿童药品综合评价质量控制的统一规范、标准及指标,对分中心和第三方专业评估团队开展的有关评估工作进行质量控制。质量控制重点包括从业人员资质审查、组织流程合规程度、方法学严谨性、数据可靠性及报告质量等。建立质控结果反馈机制,推动评估机构优化工作,不断提升药品综合评估的质量及效果。同步健全儿童药品评价证据共建共享共用机制,综合利用已有的药物评估数据和政策信息,开展质量分级和校验,逐步建立疾病分型与药品技术评价、政策评估多维分析模型,健全科学规范长效实施机制。

2.重点机构质量控制

医疗卫生机构和临床医师、药师等专业技术人员是评价质控的主力军。鼓励医疗机构、科研院所、行业学协会等机构结合基础积累、技术特长和临床用药需求,对药品临床使用的安全性、有效性、经济性等开展综合评价。同时,对参与评价的人员,注重加强其职业道德教育、专业技术培训和业务经验交流。对具备条件的重点医疗机构,赋予儿童药品临床综合评价基地资质或采信其临床证据。

3.重点环节质量控制

承担儿童药品临床综合评价任务的药政管理、医疗卫生机构和专业技术机构,①召开“实施培训会”,进一步明确重点问题,细化流程方法;②召开“中期讨论会”,对标起始设计和阶段性进展,及时完善管理方法并梳理实施细节问题;③召开“初步结果建议沟通会”,进一步听取利益攸关方意见和陈述,持续完善各方支持依据;④适时开展“技术咨询”,就评价实施过程中的专业技术问题,充分听取专业机构、专业人员和患儿及家属代表的意见。通过建立核心工作机制,逐步健全完善重点环节质量管理规范。

(1)行政管理环节:

各研究申报获批医疗卫生机构应高度重视综合评价研究工作,组成院长或分管副院长、药剂科主任牵头的领导小组,保障综合评价研究工作的顺利开展。

(2)培训环节:

评价工作开始之前需要对参与评价的各相关单位成员进行培训,统一评价工作要求和评价方法。由研究申报获批医疗卫生机构负责组织培训,并存留相关证据,包括但不限于培训对象、培训内容、培训方式、培训效果。

(3)方案设计环节:

在方案设计阶段,方案设计成员应包括临床、药学、流行病学和卫生统计学等领域的专业人员,以及卫生经济学、医疗保险和卫生政策等方面的学者,以保障评价工作中经济学评价的科学性并紧扣评价工作设立之初的政策方向。

(4)实施环节:

评价工作开始之后需要定期或不定期地对评价工作进行事中督导,及时解决评价工作中出现的问题,防止评价工作偏离研究设计方向。由研究申报获批医疗卫生机构负责组织对相关参与评价工作的机构进行内部督导检查,并存留相关证据,包括但不限于督导对象、督导内容、督导方式、督导结果。

国家及地方儿童临床药品综合评价工作的组织管理机构应建立外部质控工作机制,依靠国家和省级儿童药品综合评价专家库的专家力量,做好外部质控工作,并存留相关证据,包括但不限于督导对象、督导内容、督导方式、督导结果。

五、讨论

上述儿童药品临床综合评价技术指南的核心内容是课题组和广大专家、卫生决策者共同努力的成果。围绕我国儿童药品临床综合评价的政策要求和实际工作的需要,本节总结、梳理了儿童药品临床评价的主要内容与维度、评价设计与分析方法、数据来源以及质量控制方法等方面评价工作所要遵循的原则、采取的流程、选择的指标和适用的方法,为未来我国儿童药品临床综合评价工作提供了方法学上指引,为推动药品临床综合评价方法的标准化、规范化方面迈出了坚实的一步,必将对提升我国儿童药品临床综合评价工作的整体水平产生深远影响。

当然,研究结果还不可避免地存在一些问题,如涉及多种类型指标的综合评价方法学问题、涉及评价工作可行性的真实世界数据收集问题、涉及样本量的临床多中心评价工作机制问题等等。目前仍在持续开展后继儿童药品临床评价试点工作,将在及时总结有关试点经验基础上不断完善综合评价方法及工具。

(刘克军 肖 月 邱英鹏 孙潭霖)

参考文献

[1]刘芳,黄少军,石元元,等 .国外药物经济学评价在我国政策决策中的借鉴研究[J].中国药物评价,2014,31(3):184-188.

[2]门鹏,唐惠林,翟所迪. 药品卫生技术评估的步骤与方法.中国医疗保险,2015.57-59.

[3]Doherty P,Kirsa S,Chao S,et al. SHPA Standards of Practice for Drug Use Evaluation in Australian Hospitals:SHPA Committee of Specialty Practice in Drug Use Evaluation[J]. Journal of Pharmacy Practice and Research,2004,34(3):220-223.

[4]刘岳,张亮 . 卫生系统绩效评价理论框架的研究进展[J]. 医学与社会,2008,21(8):29-31.

[5]邵蓉,彭小宸,陈永法 . 国家药物政策相关立法研究[J]. 中国合理用药探索,2013,10(5):88-94.

[6]张新平,王洪涛,唐玉清,等 . 国家基本药物制度政策回顾研究[J]. 医学与社会,2012,25(9):28-31.

[7]胡善联 . 我国基本药物制度改革的进展与挑战[J]. 中国卫生政策研究,2012,5(7).

[8]甄伟玲,张新平,陈昊,等 . 国家药物政策的关键元素和评价指标探讨[J]. 中国卫生质量管理,2004,11(4):56-59.

[9]刘宝,武瑞雪,叶露 . 论基本药物的可获得性和可及性障碍[J]. 中国药房,2007,18(14):1041-1043.

[10]Medicine prices,availability,affordability and price components,2ND EDITION.

[11]Xu K1,Evans DB,Kawabata K,et al.Household catastrophic health expenditure:a multicountryanalysis.Lancet,2003,12,362(9378):111-117.

[12]胡善联 . 论中国卫生与健康的价值观[J]. 卫生软科学,2018(1):3-6.

[13]宣建伟,李幼平 . 真实世界研究与创新药物价值[J]. 中国循证医学杂志,2018,18(4):273-276.

[14]郑荣寿,孙可欣,张思维,等 . 2015 年中国恶性肿瘤流行情况分析[J]. 中华肿瘤杂志,2019,41(1):19-28.

[15]国家卫生健康委员会.2018中国卫生健康统计年鉴[M].北京:中国协和医科大学出版社,2018.

[16]National Cancer Institute.CancerTreatment:Type of Treatment[EB/OL].[May2019].https://www.cancer.gov/about-cancer/treatment/types.

[17]国家药典委员会. 中华人民共和国药典临床用药须知(化学药和生物制品卷)[M].中国医药科技出版社,2015年版.

[18]国家卫生健康委员会医政医管局.关于印发新型抗肿瘤药物临床应用指导原则(2018年版)的通知[EB/OL].(2018年09月14日)[2019年5月].

[19]http://www.nhc.gov.cn/yzygj/s7659/201809/0ea15475f58a4f36b675cfa4716fa1e4.shtml.

[20]《中国药物经济学评价指南》课题组,刘国恩,胡善联,et al. 中国药物经济学评价指南(2019版)[M]. 2019.

[21]国家食品药品监督管理总局.总局关于发布化学药品注册分类改革工作方案的公告(2016年第51号)[EB/OL].(2016年 03月09日)[2019年 5月].http://samr.cfda.gov.cn/WS01/CL0087/146603.html.

[22]布拉德伯恩,萨德曼,万辛克.问卷设计手册:市场研究、民意调查、社会调查、健康调查指南[M].赵锋,译.重庆:重庆大学出版社,2010.

[23]WHO,HAI. Medicine prices:a new approach to measurement. Working draft for field-testing and revision[EB/OL].(2003)[2010-03-01]. http://www.haiweb.org/medicineprices/manual/manuals/MedicinePrices.pdf.

[24]Niëns LM,Van de Poel E,Cameron A,et al. Practical measurement of affordability:an application to medicines [R].Rotterdam:Institute of Health Policy and Management,Erasmus University,2009.

[25]张虹,高晨燕,陈晓媛,等 . 关于采用单臂临床试验数据用于支持进口药品注册的考虑[J]. 中国新药杂志,2013(18).

[26]郭申阳 . 倾向值分析:统计方法与应用[M]. 重庆:重庆大学出版社,2012.

[27]于石成,王琦琦,张曼晖.倍差法及其在公共卫生领域中的应用[J].疾病监测,2019,34(03):272-277.

[28]邵华,王琦琦,胡跃华,等. 中断时间序列分析及其在公共卫生领域中的应用[J]. Chinese journal of Epidemiology,2015,36(9):1015-1017.

[29]Budget Impact Analysis—Principles of Good Practice:Report of the ISPOR 2012BudgetImpactAnalysisGoodPracticeⅡTask Force[EB/OL].https://www.ispor.org/heor-resources/good-practices-for-outcomes-research/article/principles-of-goodpractice-for-budget-impact-analysis-ii.

[30]国家心血管病中心. 中国心血管病报告2018[M]. 北京:中国大百科全书出版社,2019.

[31]The World Bank. Toward a Healthy and Harmonious Life in China:Stemming the Rising Tide of Non-Communicable Diseases[J].2011.

[32] Jiang L,et al. Achieving best outcomes for patients with cardiovascular disease in China by enhancing the quality of medical care and establishing a learning health-care system [J]. Lancet,2015,386(10002):1493-1505.

[33]《中国药物经济学评价指南》课题组. 中国药物经济学评价指南(2019版),2019.

[34]WHO/HAI.Measuring medicine prices,availability,affordability and price components[J]. Geneva World Health Organization,2008,8(6-7):504-507.

[35]杨克虎 .系统评价指导手册[M].北京:人民卫生出版社,2010.

[36]李静,张鸣明.Cochrane 干预措施系统评价手册中文翻译版2014[M].四川大学华西医院中国Cochrane中心,兰州大学循证医学中心,2014.

[37]国家药品监督管理局药品审评中心. 真实世界证据支持药物研发的基本考虑(征求意见稿)[J].2019.

[38]沈洪兵,齐秀英 .流行病学[M].北京:人民卫生出版社,2013:38.

[39]Streubert H J,Carpenter D R. Qualitative research in nursing :advancing the humanistic imperative [M]. 4th ed. Philadelphia:Williams & Wilkins,Lippincott,2007.

[40]李鲁. 社会医学:社会医学研究方法[M].北京:人民卫生出版社,2012.

[41]2016年儿童用药安全调查报告,南方医药经济研究所,2016.

[42]刘丹,程静,张伶俐,等. WHO、印度、南非儿童基本药物目录与中国2012版基本药物目录的比较研究[J]. 中国循证医学杂志,2015(4):393-402.

[43]张雅婷,杨佳卉,等 . 我国药品说明书中儿童用药标示情况研究[J]. 中国药物评价,2016,33(4):231-234.

[44]国家基本药物目录(2012 年版).儿童用药超说明书使用现状分析[J]. 中国药学杂志,2015,50(21):1923-1926.

[45]朱晓虹,姜德春,刘相佟,等. 儿科医师超说明书用药处方行为与认知现状调查[J]. 儿科药学杂志,2013(12):33-37.

[46]中华医学会儿科学分会临床药理学组. 中国儿科超说明书用药专家共识[J]. 中华儿科杂志,2016,54(2):101-103.

[47]杜雯雯,徐伟,蔡功杰,等 . 中国儿童用药可及性分析[J]. 中国现代应用药学,2018,35(1).

[48]高华,邓宁,孙维红,等 . 某院 2016年儿外科门诊超说明书用药现状分析[J]. 儿科药学杂志,2018(10).

[49]张伶俐,李幼平,黄亮,等. 四川大学华西第二医院儿科门诊处方超药品说明书用药情况调查[J]. 中国循证医学杂志,2011,11(10):1120-1124.

[50]张伶俐,李幼平,梁毅,等. 全球门诊儿童超说明书用药现状的系统评价[J]. 中国循证医学杂志,2012,12(3):305-313.

[51]杜雯雯,徐伟,蔡功杰,等 . 中国儿童用药可及性分析[J]. 中国现代应用药学,2018,35(1).

[52]https://training.cochrane.org/sites/training.cochrane.org/files/public/uploads/resources/CochraneHandbookChineseDec2014.pdf

[53]Atkins D,Eccles M,Flottorp S,et al. Systems for grading the quality of evidence and the strength of recommendations I:Critical appraisal of existing approaches The GRADE Working Group[J]. Bmc Health Services Research,2004,4(1):38.