要闻列表OpenAI 称其为医生打造的新版 ChatGPT 在临床任务中表现优于人类
Decrypt2026-04-23 17:30:11

OpenAI 称其为医生打造的新版 ChatGPT 在临床任务中表现优于人类

ORIGINALOpenAI Says Its New ChatGPT for Doctors Outperforms Humans in Clinical Tasks
AI 影响分析Grok 分析中...
📄完整原文· 由 trafilatura 自动抓取Gemini 翻譯3338 字
简讯 - OpenAI 推出了 ChatGPT for Clinicians,这是一个专为支持临床任务(如文档记录和医学研究)而设计的专业版本。 - 该平台对经过验证的美国医师、执业护士、医师助理和药剂师免费开放。 - OpenAI 表示,根据其自身的基准测试,该聊天机器人在某些临床任务中的表现优于人类医生。 OpenAI 周三发布了面向医师、执业护士、医师助理和药剂师的免费专业版 ChatGPT,进一步加深了该公司在医疗保健领域的布局,以应对该行业面临的人员短缺、行政负担过重和职业倦怠等问题。 该产品名为 ChatGPT for Clinicians,旨在处理文档记录、医学研究和护理咨询——这些耗时的任务占用了临床医生本可用于患者的时间。目前仅限美国境内经过验证的从业者使用,并计划向国际市场扩展。 此次发布正值 AI 在医学领域的应用激增之际。根据 OpenAI 引用的 American Medical Association 2026 年的一项调查,72% 的医师目前在临床实践中使用 AI,而一年前这一比例仅为 48%。该公司表示,过去一年中,临床医生对其平台的使用量翻了一番以上,每周有数百万人依赖 ChatGPT。 该工具的功能包括:利用数百万篇同行评审来源的临床搜索功能、用于医学文献综述的深度研究模式、针对转诊信和预先授权请求等任务的可重复使用工作流模板,以及在平台内研究临床问题时获得继续医学教育学分的能力。 对话内容不会用于训练 OpenAI 的模型,且符合 HIPAA 合规性的支持可通过符合条件的账户签署 Business Associate Agreement 来实现。 在发布该工具的同时,OpenAI 还发布了 HealthBench Professional,这是一个旨在评估 AI 在护理咨询、文档记录和医学研究这三大类现实临床任务中表现的新基准。 该公司报告称,在 ChatGPT for Clinicians 工作区中运行的 GPT-5.4 在该基准测试中得分为 59.0,高于人类医师(即使在拥有无限时间和互联网访问权限的情况下,人类医师的得分也仅为 43.7),同时也高于来自 Anthropic、Google 和 xAI 的竞争模型。 然而,这些结果有一个重要的前提:OpenAI 既开发了该产品,也开发了用于评估该产品的基准测试。 该公司表示,为了开发该工具,他们与数百名医师顾问进行了合作,并审查了超过 700,000 条模型回复。在预测试中,医师对近 7,000 次对话中 99.6% 的回复评价为安全且准确。 OpenAI 一直谨慎地将该工具定位为支持系统,而非临床判断的替代品——随着产品更广泛地推广,监管机构和怀疑论者可能会密切关注这一区别。 医疗保健代表着 AI 工具一个快速扩张的市场。除了 OpenAI 的数据显示临床医生对 ChatGPT 的使用量在过去一年中翻了一番以上外,McKinsey 的数据表明,50% 的医疗保健领导者报告其组织已经实施了生成式 AI,高于 2024 年第四季度的 47% 和 2023 年第四季度的 25%。与此同时,BCG 的研究显示,60% 的消费者已经在使用 AI 进行个人健康管理。
数据状态✓ 已抓取全文阅读原文(Decrypt)
🔍历史类似事件· 关键词 + 标的比对6 则
💡 目前用关键词 + 标的比对(MVP)· 之后会升级为 embedding 语义搜寻
原始信息
ID:5b5cca5215
来源:Decrypt
发布:2026-04-23 17:30:11
分类:一般 · 导出分类 neutral
标的:未指定
社群投票:+0 /0 · ⭐ 0 重要 · 💬 0 留言