期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

免费

1篇

专业分类

眼科学

1篇

出版年

2024年

1篇

排序方式： 共有1条查询结果，搜索用时 0 毫秒

不同大型语言模型与不同水平医学专业人士回答眼科问题的对比研究

下载免费PDF全文

黄慧胡瑾瑜王晓宇叶书苑吴世楠陈程何良琪曾艳梅魏红邵毅《国际眼科杂志》2024,24(3):458-462

目的：评估3种不同的大型语言模型(LLM，包括GPT-3.5、GPT-4和PaLM2)在回答眼科专业问题中的表现并与3种不同水平的专业人群(医学本科生、医学硕士、主治医师)进行比较。

方法：分别对三种不同的LLM和3种不同水平的专业人群(包括了本科生9名，专业型研究生6名，主治医师3名)进行一项由100道眼科单项选择题组成的测试，问题涵盖了眼科基础知识、临床知识、眼科检查诊断方法以及眼病相关治疗手段。从平均得分、答题稳定性和答题自信心等方面综合评估LLM的性能并与人类组进行比较。

结果：在平均测试得分中，每个LLM都在总体上优于本科生(GPT-4：56分，GPT-3.5：42分，PaLM2：47分，本科生：40分)，其中GPT-3.5、PaLM2略低于硕士水平(硕士：51分)，而GPT-4则表现出与主治医师相当的水平(主治医师：62分)。另外，GPT-4表现出明显高于GPT-3.5和PaLM2的答题稳定性和答题自信心。

结论：以GPT-4为代表的LLM在眼科领域表现的较为出色，LLM模型可为临床医生和医学教育进行临床决策及教学辅助。相似文献