AI开启卫生经济大数据黑匣-医药经济报

医药经济报 > 正文

AI开启卫生经济大数据黑匣

发布时间：2022-06-20 10:29:41作者：胡善联复旦大学公共卫生学院教授来源：医药经济报

最近，人工智能（artificial intelligence, AI）的卫生经济学评价成为热门话题。今年5月在美国华盛顿召开的国际卫生经济学和结果研究大会组织了专题研讨会，介绍如何综合运用人工智能和机器学习的方法用于卫生经济和结果研究。

人工智能是指“能够执行通常需要人类智能任务的计算机系统”，是2022-2023年卫生经济与结果研究十大趋势之一。通过使用算法分析大量数据，对真实世界研究中可用的证据（RWE）和数据（RWD）进行分析，总结医疗实践并预测可能出现的结果。

目前有两种方法使用数据库和机器学习来分析RWE。一种是观察病人证据以获得监管部门的批准和了解疾病；另一种是随机对照试验（RCT）重复方法，应用流行病学技术，使用前瞻性纵向数据进行随机、对照重复试验。模拟RCT并比较结果，为临床试验提供建议。

科学溢价与希望价值

通过临床人工智能的应用，有助于增进健康与卫生保健服务的利用，帮助临床诊断和治疗决策。随着个人及人群健康电子信息数据日益增长，包括电子病历和影像的各种信息以及个人可穿戴电子、数码设备提供的大量有价值的健康数据，有利于治疗决策以及反映患者的健康结果，进一步促进了人工智能和机器学习方法（machine learning methods，ML）的发展。

人工智能的价值在于对未来临床应用的科学溢价和对患者的希望价值：能够提高临床工作效率和诊断的准确性；改善临床专科治疗的可及性；拓展临床专业知识，改进临床决策；临床医师工作自动化，减少重复的临床任务负担, 降低医疗费用和边际成本。

当然，人工智能也面临伦理、立法和经济等多方面挑战。

面临三个棘手问题

当前人工智能面临的问题有：1.人工智能能否像其他卫生技术一样进行卫生技术评估？2.人工智能在卫生保健服务中的效率以及目前的认知状况如何？3.医疗人工智能目前被接受和采纳的程度如何？

人工智能设备评价存在很多难点：

首先，人工智能设备的价值需要进行卫生技术评估，但比药品评价复杂得多。人工智能的试验组往往缺乏一致性，难以界定干预组与标准治疗组的参照比较。采用卫生经济学模型评价的设计需要适应人工智能工具的预期应用，由卫生技术评估专家与人工智能专家以及临床医生一起，考虑将所有可能的参照方式进行更多参照比较。

其次，人工智能有较多间接成本，包括辅助人员、信息技术人员的劳务成本、信息数据的收集、储存和处理成本。这与药品评价中的成本计算大不同。人工智能能够节省医疗工作时间，但也可能易于产生假阳性结果或过度诊断。

第三，人工智能的效率会随着资料数据的累积和改进操作而与时俱进，需要用动态的方法去分析效果的变化。

认知水平有待提高

目前对卫生保健服务中人工智能的科学认知水平有限，主要是文献研究且研究重点在成本研究或以AI为基础的正确性研究，回顾性观察研究的时长大部分在一年以内，缺乏对长期安全性和健康结果影响的观察。已有评价报告的质量也不理想，由于临床资料收集比较困难，所用方法存在不可预见性和人工智能技术的不确定性，只在某些特定人群中可以使用，由此产生评价报告结果的偏倚。

虽然人工智能对卫生保健具有增加价值和提高效率的作用，但临床实践应用还不够充分。其原因是：尽管有关健康电子信息明显增加，但质量不高，而且不可能做到信息共享。一般公众对人工智能设备缺乏信任感，而且受到年龄、教育程度、技术透明度、公共传媒宣传以及与临床应用的广泛性等因素的影响。

AI技术具有不确定性，所有AI的临床试验都是与临床医师的实践进行比较，可以提供及时的信息作为临床医师决策的支持，或可与医师共同做出决策，为临床医师读片做出独立判断。

机器学习方法应用

国际卫生经济学和结果研究协会（ISPOR）机器学习工作组在2022年会上讨论了如何应用机器学习来支持卫生经济和结果研究。

机器学习可在以下五个方面应用：1.改进患者队列的选择，根据纳入标准，更好地确定特异的样本；2.帮助确定独立的预测因子和协变量的健康结果；3.改善健康结果的预测分析；4.改进因果推断，使用有针对性的最大似然估计或双重去偏估计，更快产生可靠的证据，不需要再应用昂贵、耗时的随机对照试验；5.应用于经济模型的开发，以减少结构、参数和抽样不确定性的成本效果分析。

目前提出运用PALISADE原则作为机器学习的技术评价时主要考虑因素。P是明确目的（purpose）、A是注重适宜性（appropriateness）、L是看到局限性（limitations）、I是执行(implementation)、S是方法的敏感性和特异性（sensitivity & specificity）、A是算法特性（algorithm characteristics）、D是数据特征（data characteristics）、E是结果的可解释性（explainability）。

成本效果分析实践

荷兰Vos 等作者采用机器学习装置根据ICU治疗途径7个Markov 模块状态模型，为ICU病房预测患者出院的最佳时间。观察时间为一年，假设有1000例成年患者。参照比较数据来自文献资料及专家意见，采用确定性和概率性敏感度分析及情景分析。研究结果为1个增量ICER值为每QALY€18507, 仅为患者意愿（WTP）支付值€30000的71%。证明机器学习方法比常规护理更具成本效果，敏感度分析提示减少ICU住院日是最主要的因素。

Rodriguez等利用全美2012-2016五年内4247例肺囊性纤维化成人患者纵向观察真实世界的数据，建立5个状态的患者水平的模拟模型，比较肺移植常规治疗（UC）、1秒钟呼气测定肺活量（FEV1)及机器学习（ML）三种干预措施下，评价风险预测模型的临床实用性。结果三组在肺移植率、移植前或移植后死亡、5年总生存率无明显差异，该机器学习风险预测模型在真实世界研究中未提供有意义的结果。

结论<<<

大部分人工智能设备处于研究阶段，需进一步加强研究，并需要进行动态的卫生经济学评价，包括对疗效以及可能产生的副反应进行研究。还需进一步增加真实世界研究，评价其对一般人群的影响；将人工智能更好地应用于临床患者的诊断、降低医疗费用、改善卫生系统的经济价值，提高服务效率。

此内容为《医药经济报》融媒体平台原创。未经《医药经济报》授权，不得以任何方式加以使用，包括转载、摘编、复制或建立镜像。如需获得授权请事前主动联系：020-37886610或020-37886753；yyjjb@21cn.com。