正确测试用于医疗环境的 AI 系统是一个复杂的多阶段过程。但发布此类分析结果的开发人员相对较少。一项综述显示,2020 年至 2022 年期间仅发表了 65 项 AI 干预的随机对照试验。与此同时,美国食品药品监督管理局 (FDA) 等监管机构已批准数百种 AI 驱动的医疗设备供医院和诊所使用。
「医疗保健机构发现许多获批的设备没有经过临床验证。」加利福尼亚州洛杉矶西达赛奈医疗中心 (Cedars-Sinai Medical Center) 的心脏病专家 David Ouyang 说。一些医院选择自己测试此类设备。
尽管研究人员知道理想的 AI 干预临床试验应该是什么样的,但在实践中,测试这些技术具有挑战性。实施取决于医疗保健专业人员与算法的互动程度:如果人类忽略了它的建议,一个完美的工具也会失败。AI 程序对它们所训练的人群和它们旨在帮助的人群之间的差异特别敏感。此外,目前还不清楚如何最好地向患者及其家属介绍这些技术,并征求他们的同意使用他们的数据来测试这些设备。
一些医院和医疗保健系统正在试验在医学中使用和评估 AI 系统的方法。随着越来越多的 AI 工具和公司进入市场,各组织正在聚集在一起,就哪种评估最有效、最严格达成共识。
谁在测试医疗 AI 系统?
基于 AI 的医疗应用,例如 Singh 正在开发的应用,通常被药品监管机构视为医疗设备,包括美国 FDA 和英国药品和保健产品监管局。因此,审查和授权使用的标准通常不如药物标准严格。只有一小部分设备(可能对患者构成高风险的设备)需要临床试验数据才能获得批准。
许多人认为门槛太低了。当费城宾夕法尼亚大学的重症监护医生 Gary Weissman 审查其领域内 FDA 批准的 AI 设备时,他发现,在他确定的十种设备中,只有三种在授权中引用了已发布的数据。只有四个提到了安全评估,没有一个包括偏见评估,该评估分析该工具的结果是否对不同患者群体公平。「令人担忧的是,这些设备确实可以并且确实会影响床边护理。」他说,「患者的生命可能取决于这些决定。」
缺乏数据使得医院和医疗系统在决定是否使用这些技术时处于困境。在某些情况下,财务激励措施会发挥作用。例如,在美国,健康保险计划已经为医院使用某些医疗 AI 设备提供报销,这使得它们在经济上具有吸引力。这些机构也可能倾向于采用承诺节省成本的 AI 工具,即使它们不一定能改善患者护理。
Ouyang 说,这些激励措施可能会阻止 AI 公司投资临床试验。「对于许多商业企业来说,你可以想象,他们会更加努力地确保他们的 AI 工具可以报销。」他说。
不同市场的情况可能有所不同。例如,在英国,由政府资助的全国性健康计划可能会在医疗中心购买特定产品之前设置更高的证据门槛,英国伯明翰大学研究 人工智能 负责任创新的临床研究员 Xiaoxuan Liu 说,「这样,企业就有动力进行临床试验。」