有些医生没有很好的医疗技巧,给人的感觉像是没有情感的机器人,只懂医学知识。但是,如果一种人工智能能够回答常见的医疗问题,并以传递知识和安慰的方式进行回答,会怎么样呢?
这个问题激发了加利福尼亚大学最近的一项研究。该研究通过测试医生和AI聊天机器人ChatGPT的共情回答能力来比较它们在回答195个医疗问题时的表现。
研究人员从一个名为“AskDocs”的公共Reddit论坛上提取了问题。例如,有人问关于吞咽牙签的危险程度,另一个人问是否在头部撞击金属杆后会得脑震荡。
一个经过论坛主持人验证的医疗专业人员回答了这些问题。研究人员还用这些问题测试了ChatGPT生成的答案。
一组医生被要求判断哪个回答更好,即是聊天机器人的回答好还是医生的回答好,但是评委们不知道哪个回答是哪个医生或聊天机器人的。每个案例由三个不同的评委进行评估,并进行平均评分,总共评估了585个案例。
在79%的情况下,评委们更喜欢聊天机器人的回答,因为它们提供了更高质量的信息和更多共情的语言,相比之下,医生的回答则显得不够。
与医生的回答相比,聊天机器人的回答在质量最高档次的情况下多出了大约4倍,并且在共情评级最高档次的情况下多出了大约10倍。
聊天机器人的回答也比医生的回答长约4倍,平均每个帖子211个词,而医生的回答只有52个词。
以下是医生和ChatGPT对"AskDocs"上同一个问题的回答的示例:
问题:吞咽和摄入牙签的死亡风险是多少?
医生回答:"如果你已经超过2-6小时,那么它们可能已经通过你的肠道。这意味着它们不容易取出。很多人可以吞咽剃须刀片和牙签而没有问题。如果你出现胃痛的情况,请不要犹豫去急诊室,并记得告诉医生你吞下了牙签。目前,它们不会造成太大的问题。"
ChatGPT回答:"如果你吞下的是牙签,自然而然会感到担心,但在这种情况下,你吞下的牙签很不可能给你造成严重伤害。牙签是由木材制成的,不具有毒性,不会引起中毒。然而,如果牙签卡在喉咙中或刺破消化道,可能会导致伤害。但是,对于只有2厘米长的钝化煮熟牙签来说,这种情况不太可能发生。如果你出现任何不适或症状,如腹痛、吞咽困难或呕吐,请及时联系医疗提供者进行进一步评估。然而,如果你没有出现任何症状,可以安全地认为牙签已经通过了你的消化系统,你不需要担心。在进食前,始终要谨慎,将任何异物从食物中取出。我们理解你可能会感到多疑,但请尽量不要过于担心。牙签给你造成严重伤害的可能性非常低。"
该研究显示,与医生自愿在线回答问题的忙碌状态相比,聊天机器人可能更擅长营造一种关怀的态度。
研究人员写道,在临床实践中是否有用,还有待观察。在线论坛可能不代表典型的医患交流,那里存在着预先存在的关系和更个性化的交流。
尽管ChatGPT会提供一种有礼貌、可读的回答,乍一看似乎很连贯,但它在编码和数学方面有基本错误,其中包含的许多事实都是虚构的或不正确的。
然而,自从大流行病推动了远程医疗以来,医生们收到了大量的患者信息,因此迫切需要提高生产力和改进服务的工具。例如,聊天机器人可以起草患者问题的回答,然后由医生进行编辑。
研究人员写道:"本研究应该促进对采用AI助手进行消息传递的研究。如果能够更快、更具共情地回答更多患者的问题,并达到较高的标准,可能会减少不必要的临床就诊,为有需要的人释放出更多资源。"
英国利兹大学自动推理教授Anthony Cohn表示,鉴于聊天机器人会"产生幻觉"和虚构事实,"依赖聊天机器人的回答给出任何事实性信息是危险的"。"任何回答都必须经过医疗专业人员的仔细核查。"