GPT 4在眼科领域达到专家级临床知识和推理水平

by 小互
7月 ago

英国剑桥大学临床医学院和英国牛津大学临床学术研究生院发表了一个研究报告，评估大语言模型（LLMs），特别是GPT-3.5和GPT-4在眼科的临床潜力。通过使用英国眼科医生的资格考试问题来测试这些模型，并将它们与训练有素的眼科医生及其培训中的医生进行比较。研究发现，GPT-4的表现优于GPT-3.5和其他较早的模型，与专业眼科医生的表现相当，甚至在某些方面超过了培训中的医生。

本研究旨在评估最新大语言模型（LLMs）在眼科领域的临床潜力，采用比单纯考试成绩更为严格的评估标准。研究中使用了347个眼科问题对GPT-3.5、GPT-4、PaLM 2和LLaMA进行了测试，随后在一个包含87个问题的模拟考试中，将这些模型与经验丰富的眼科医生和在培训中的医生进行了比较。这些问题涵盖了基础回忆和高阶推理两种类型。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容，每天更新。

开通会员

Categories: AI 论文

Support authors and subscribe to content

加入会员

Related Content

ElevenLabs 推出对话式AI工具 可在几分钟内为网站、应用或电话中心创建语音代理

Luma 推出 Luma Photon 和 Photon Flash 基于全新架构的图像生成模型

Hume AI 推出 Voice Control 功能 通过滑块操作即可实现个性化的语音定制

不同文本转语音（TTS）模型对比 优缺点以及场景选择

IC-Light 升级为IC-Light V2-Vary 可更灵活地调整光源位置和强度

ElevenLabs 推出对话式AI工具可在几分钟内为网站、应用或电话中心创建语音代理

Hume AI 推出 Voice Control 功能通过滑块操作即可实现个性化的语音定制

不同文本转语音（TTS）模型对比优缺点以及场景选择