目的:评估3种不同的大型语言模型(LLM,包括GPT-3.5、GPT-4和PaLM2)在回答眼科专业问题中的表现并与3种不同水平的专业人群(医学本科生、医学硕士、主治医师)进行比较。
方法:分别对三种不同的LLM和3种不同水平的专业人群(包括了本科生9名,专业型研究生6名,主治医师3名)进行一项由100道眼科单项选择题组成的测试,问题涵盖了眼科基础知识、临床知识、眼科检查诊断方法以及眼病相关治疗手段。从平均得分、答题稳定性和答题自信心等方面综合评估LLM的性能并与人类组进行比较。
结果:在平均测试得分中,每个LLM都在总体上优于本科生(GPT-4:56分,GPT-3.5:42分,PaLM2:47分,本科生:40分),其中GPT-3.5、PaLM2略低于硕士水平(硕士:51分),而GPT-4则表现出与主治医师相当的水平(主治医师:62分)。另外,GPT-4表现出明显高于GPT-3.5和PaLM2的答题稳定性和答题自信心。
结论:以GPT-4为代表的LLM在眼科领域表现的较为出色,LLM模型可为临床医生和医学教育进行临床决策及教学辅助。 相似文献
持续性角膜上皮缺损(PED/PCEDs)是指角膜损伤后10~14d内,在接受了相应治疗后,角膜也未能迅速重新形成上皮并闭合而导致的一种角膜疾病。角膜上皮的破坏和基质层的损伤容易使眼部受到感染、发生基质溃疡、穿孔、瘢痕,甚至丧失视力。就目前而言,临床医生对PED的治疗仍然面临相当大的挑战。标准的治疗方法包括配戴绷带隐形眼镜和使用人工泪液治疗,而新开发的药物则可以通过促进各类生长因子的生成使角膜重新形成上皮,进一步配合相应外科手术为角膜提供神经支配,以此达到治疗的效果。此外,确诊PED后应尽早接受治疗,以避免继发性并发症。本文就PED的流行病学、病因学、诊断与临床表现、治疗方法及预后进行综述。 相似文献