文/Katie Jennings
这家科技巨头的目标是在与亚马逊和微软的竞争中站稳脚跟,但专家表示,在医学领域,这项技术面临着很多挑战。
(资料图片仅供参考)
谷歌正在扩大其大型语言模型对医疗保健客户的访问权限。图片来源:GETTY
在医院轮班结束时,即将下班的护士必须迅速让新来的护士了解她所照顾的所有病人。这种“交接”可以采取多种形式,包括对话、手写笔记和电子病历。HCA 医疗保健公司负责医疗转型和创新的高级副总裁 Michael Schlosser 说:“这是医疗保健旅程中的一个有风险的部分,因为我们正在将信息从一个医疗保健服务提供者转移到另一个医疗保健服务提供者。我们必须确保信息传递的准确性,不能有任何疏漏。”
Schlosser和他在位于纳什维尔的HCA的团队认为,这种信息传递可能是应用生成式人工智能的好机会。HCA是美国最大的医疗保健系统之一,拥有180家医院,每年约有3700万患者。大型语言模型善于总结和组织数据,但当HCA在市场上寻找潜在的供应商时,Schlosser说,他们找不到任何公司能为这个移交问题提供解决方案。
HCA与谷歌云已有合作关系,因此他们转向谷歌名为Vertex AI的软件套件寻求帮助,该套件可以帮助客户构建和部署机器学习模型。谷歌提供了自己的基础模型PaLM,但该平台与模型并没有挂钩,这意味着客户也可以在OpenAI的GPT-4、Facebook的Llama、亚马逊的Titan或他们选择的任何其他模型上进行交换和构建。
为了吸引更多的医疗保健客户,谷歌还在开发一种针对医疗保健的大型语言模型。该公司周二宣布,将于9月向更多客户发布该模型的最新版本(名为Med-PaLM 2)。除了制药巨头拜耳(Bayer)、电子健康记录公司 Meditech 以及数字医疗初创公司 Infinitus Systems 和 Huma 之外,HCA 也是获得该模型早期使用权的几家医疗保健客户之一。在微软和亚马逊重新进军医疗保健领域之际,谷歌也在以人工智能为动力进军该领域。目前还远不清楚,当尘埃落定后,谁将脱颖而出。
咨询公司Gartner的分析师Chirag Dekate在谈到医疗领域的人工智能前景时表示:“我们在这场马拉松比赛才只跑了5分钟。”
2021年,谷歌解散了独立的谷歌医疗健康(Google Health)部门,但表示整个公司将继续开展与医疗健康相关的工作。该公司最近在该行业的人工智能解决方案旨在解决零碎的问题。例如,谷歌去年发布了人工智能工具,帮助医疗机构读取、存储和标记x射线、核磁共振成像和其他医学图像。今年早些时候,该公司又推出了人工智能工具,帮助医疗保险公司加快事先授权。
谷歌健康人工智能主管Greg Corrado表示,由于人工智能技术本身的原因,关注用例是必要的。尽管对大型语言模型进行了大肆宣传,但他表示,指望它们“能够熟练地完成任何现有的事情”是“天真的”,并补充说,“在实践中,这些系统总是需要识别特定的用例。”
在大型语言模型方面,谷歌一直在追赶OpenAI,这家初创公司开发了广受欢迎的聊天机器人ChatGPT,并获得了微软100亿美元的投资。2022年,微软以188亿美元收购了Nuance Communications,为其向医院客户销售新的人工智能产品提供了一个重要的立足点,因为Nuance的医疗听写软件已经被55万名医生使用。CB Insights分析师Alex Lennox-Miller表示:“Nuance在医疗保健领域有着巨大的影响力。”这使得微软在将其其生成式人工智能软件应用于该行业的行政工作方面处于“有利地位”。
在生成式人工智能热潮之前,亚马逊、微软和谷歌都在争夺云计算客户。根据技术研究公司Gartner的数据,到2022年,亚马逊的云计算收入将达到481亿美元,占据约40%的市场份额。微软以21.5%的份额紧随其后,而谷歌则以超过90亿美元的云收入和7.5%的市场份额排在阿里巴巴集团之后,位列第四。
Dekate说,这些公司现在都在专门瞄准医疗保健客户,这也不足为奇,因为这是一个复杂且受到严格监管的行业。他说,这是因为如果你能够在更复杂的环境中证明用例,比如医疗保健或金融服务,那么它就向其他客户发出了一个信号,即生成式人工智能已经准备好被更广泛地采用。
但还没有人做到这一点。Dekate说,所有云计算公司向客户展示的都是构建模块。也就是说,有很多方法可以在客户必须构建的定制应用程序中利用他们的人工智能平台,但这些客户想要的是完整的解决方案。
Dekate表示:“亚马逊、谷歌和微软正在为占据人工智能经济的制高点而展开竞争。但他们都没有讲出一个足够好的垂直领域故事。”
由于医疗保健受到高度监管,犯错的后果也很严重,因此生成式人工智能用例需要从很小的规模开始。对于HCA来说,这意味着一家医院——UCF诺娜湖医院(UCF Lake Nona)——目前正在试用这种交接工具作为概念验证。Schlosser说,人工智能会从过去12小时内获取的患者数据,包括化验结果、用药情况、重要事件等生成一份转诊摘要,其中还包括对即将接手的护士在未来12小时内应该考虑的事项建议。
虽然它是使用谷歌的Vertex AI软件构建的,但HCA一直在试验不同的基础模型,包括PaLM和Med-PaLM。Schlosser说:“实际上,我们现在正在做很多正面交锋的测试,看看通用模型在哪些方面工作得更好,而经过医学训练的模型在哪些方面提供了更高的准确性和更好的结果。我认为,在我们试图创造的未来,这两者实际上都将发挥重要作用。”
Dekate说,使用多个模型来解决一个复杂问题的想法,即所谓的“复合”人工智能,对云技术提供商来说是一个有趣的挑战。他说,他们在提供自己的内部模型的同时,也在与其他公司合作,以提供“选择的承诺”。Dekate预计,我们将越来越多地看到谷歌、微软和亚马逊开始提供服务,帮助客户评估不同的模型。Schlosser说,到目前为止,HCA一直在采用人工方法进行评估,让医生和护士评估模型的输出,并将其与人类团队的做法进行比较。
Corrado表示,就目前的技术水平而言,生成式人工智能模型可以被比作“一个渴望学习、非常努力地做好工作的助手。你应该批判性地看待它的输出结果,把它当作草稿,然后看看它漏掉了什么,或是做错了什么?”
OpenAI认为,当涉及到模型的训练时,数据量越大越好。它的GPT-3模型是在开放的互联网上训练的,有大约1750亿个参数,而最新版本的GPT-4被认为有超过1万亿个参数(尽管该公司尚未公开证实这一数字)。谷歌表示,他们最大的PaLM和Med-PaLM模型有5400亿个参数。该公司拒绝就PaLM 2的规模置评。
但是,随着模型在越来越多的数据集上进行训练,其性能可能会出现问题。今年7月,来自斯坦福大学和加州大学伯克利分校的一组研究人员表示,他们的测试表明,随着时间的推移,GPT-4的性能出现了一些下降,这与在开发者论坛上的传闻不谋而合。尽管这只是一个初步的发现,而且研究人员仍在研究生成式人工智能模型的工作原理,但这确实引发了一些担忧,尤其是在目前还不完全清楚人工智能系统是如何得出答案的情况下。Lennox-Miller说:“这些算法在医疗保健领域面临的最大问题之一将是它们难以做到透明。”
Corrado说,这些担忧正是谷歌正在试验小众LLM 模型的原因,这些模型是在较小的数据集上训练的。他说,如果不针对医疗保健等特定用例量身定制模型,“你得到的工具可能就只会像一把瑞士军刀,它不是最好的刀,不是最好的螺丝刀,也不是最好的牙签。我们认为,特别是在这些高价值的环境中,更好的做法是进行领域适应,了解用例是什么,并进行与实际产品相同的严格质量评估和版本控制。”
对于大多数大型语言模型来说,另一个挑战是它们不能持续学习。他们的训练数据通常有一个截止日期。例如,免费版本的ChatGPT的训练数据截止到 2021 年 9 月。但是医疗保健方面的知识总是在不断进步的,所以使用这些工具的医生需要清楚地知道他们正在处理的数据的最新情况。Corrado表示,谷歌仍在决定具体的截止日期,但会告知客户。“我们不能依赖这些系统来了解医学实践的一切。”Corrado说。
在未来的医院里,Schlosser设想了一个“护理团队的人工智能助手”,他认为这种助手将 "在减轻行政负担方面发挥惊人的作用"。HCA还一直在与谷歌和上市的环境人工智能公司Augmedix合作,在急诊室实现医疗笔记的自动化。Schlosser说,HCA的4家医院大约有75名医生正在使用这项技术。他说,医生的“圣杯”是,他们可以专注于为病人提供护理,而“记录工作会自动搞定”。 他们之所以从急诊室开始,是因为急诊室是证明该技术实际效果最复杂的场所之一。
Schlosser说,在使用Augmedix的工具时,医生会直接征求患者的同意,记录检查情况,并使用人工智能工具做笔记。他说,护士的交接工具不是面向病人的,它属于 HCA 更广泛的隐私同意范围,涉及将患者数据用于研究和流程改进。HCA还致力于将生成式人工智能用于急诊室出院摘要,以及从急诊室到住院病人的交接。Schlosser表示,当HCA考虑将人工智能用于管理目的时,该公司将不得不考虑“让所有患者知道人工智能是医疗服务过程的一部分的正确方式”。
同意和隐私是人工智能在医疗保健领域使用的主要问题,谷歌早些时候与医院系统Ascension合作,利用人工智能分析了数百万份医疗记录,引发了重大争议。2019年,该公司的“南丁格尔项目”报告引发了对数据隐私和安全的担忧。谷歌和Ascension都表示,这项工作符合美国联邦患者隐私法。
在PaLM和Med-PaLM的案例中,谷歌表示,这些模型都没有接受过HCA或任何其他客户的患者数据训练。“HCA的数据是HCA的数据,不是别人的,”谷歌云首席执行官Thomas Kurian安告诉《福布斯》。“可以把它想象成我们云中的一个保险库,只用于训练他们正在使用的模型版本。它不与任何人共享,这些数据都不会用于改进我们的基本模型。”
尽管从技术能力到隐私和数据问题,生成式人工智能都面临挑战,但Schlosser乐观地认为,基于技术的工具将成为医生标准工具包的一部分。他说,HCA正在采取一种渐进的方法,以减轻医生日常工作的一些负担,因为他认为,一旦医生开始接受人工智能,他们将能够指导将其用于更复杂应用的最佳方式。
他说:“在我们开始进入一些更具争议的领域之前,我希望临床医生完全接受人工智能,将其视为让他们的生活更轻松的合作伙伴。”
译自https://www.forbes.com/sites/katiejennings/2023/08/29/google-healthcare-generative-ai/?sh=3afaee3f7eab