上海人工智能实验室发布 新版中文医疗大模型权威评测平台(上海人工智能实验室怎么样)

近日,上海市人工智能实验室发布中文医疗大模型权威评测平台MedBench 4.0,这是国内首个面向垂直大模型、专用大模型、应用场景的医疗大模型评测与验证体系。业内人士介绍,MedBench 4.0为衡量医学AI产品性能与可靠性提供了科学标尺,保障了医疗人工智能产品质量的提升与行业良性竞争。

据悉,中文医疗大模型权威评测平台MedBench首发于2023年年中,目前更新至第四版。上海人工智能实验室医疗和评测中心负责人徐捷介绍,本次升级包含『大语言模型』、多模态大模型及智能体三大技术范式,深度对齐国家《卫生健康行业人工智能应用场景参考指引》,覆盖60个全自主构建评测集,共70万余专业评测题。

记者从上海市人工智能实验室了解到,针对『大语言模型』评测,平台围绕医学知识问答、语言理解、生成、复杂推理及安全伦理等维度构建了评测集,并创新引入科学指标体系,以缓解模型信息遗漏或幻觉生成等问题对评测结果的影响;针对多模态大模型评测,瞄准医疗影像、检测报告等临床核心场景,平台可覆盖目标检测、图像分类、多模态报告质控、序列影像理解、病程动态追踪等10项细分任务,填补了中文医疗多模态评测领域的技术缺口;针对智能体评测,平台则重点解决智能体执行断层的问题,推动医疗智能体从“能对话”向“能执行、能协作”演进。

对于医疗大模型评测的意义,徐捷告诉记者,评测首先可以验证医疗大模型的合规性,其次是验证其专业性,比如会不会误诊、漏诊或者开错药,最终帮助市场更好地训练出优质的医疗大模型。

记者注意到,目前,不少通用大模型如深度求索、千问等都可以分析体检报告和检查报告。那么,医疗大模型的价值何在呢?

对此,徐捷介绍称,主流通用大模型可以满足日常健康咨询。评测显示,国内头部通用大模型的医学能力已经超过国外同类产品。但对于需要给出专业判断的医疗场景,例如要做哪些检查、如何解读报告、应开什么药或者中医方剂等,大模型还需整合大量医学数据、专家医案和临床经验等语料。医疗大模型能高效处理海量信息,提供循证参考,有助于提升医生诊疗水平、补足基层医疗短板,进而实现医学普惠。

除推出权威评测平台,上海人工智能实验室还联合专业医疗机构和相关企业,推出了儿童眼病智能筛查与精准干预系统、胃肠多模态辅助诊疗大模型等医疗人工智能应用。(记者 叶健 )

特别声明:[上海人工智能实验室发布 新版中文医疗大模型权威评测平台(上海人工智能实验室怎么样)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

探讨可靠的镀锌钢丝绳供应商,费用怎么收费才合理(镀锌产品有哪些)

在使用说明上,南通海云会根据不同的产品类型和应用场景,为客户提供详细的指导。南通海云的镀锌钢丝绳凭借其优良的品质和合理的价格,在全生命周期内能够为客户节省大量的费用。无论是对于矿业公司、造船厂等大型企业,还…

探讨可靠的镀锌钢丝绳供应商,费用怎么收费才合理(镀锌产品有哪些)

73岁三浦友和近况曝光!不住豪宅不靠儿孙,只想陪着山口百惠老去(68岁三浦友和)

2023年的一次访谈中,三浦友和被问到人生最幸福的时刻,他只用简单的三个字便道尽了他的深情:她还在。73岁的三浦友和,已经不再是那个荧幕上的男神,但在他低头捏陶土的侧影里,在他牵着妻子逛超市的背影中,藏着岁月…

73岁三浦友和近况曝光!不住豪宅不靠儿孙,只想陪着山口百惠老去(68岁三浦友和)

久违现身!『熊黛林』身材绝佳眼带疲惫,陈松伶笑眼弯弯状态佳

尤其是『熊黛林』和陈松伶,真是好久不见了。光看脸的话,真想不到她已经39岁了!陈松伶和小9岁的丈夫张铎结婚近二十年,一直没要孩子,两人常常旅游,张铎也把她宠得像小姑娘。 一圈看下来,这些久未露面的『明星』️里,状态最让…

久违现身!『熊黛林』身材绝佳眼带疲惫,陈松伶笑眼弯弯状态佳

宋威龙黑『风衣』vs『白敬亭』西装杀,谁是现偶男神顶流?(宋威龙时尚大片)

两人均因各自主演的爆款现偶剧《骄阳似我》和《你是我的城池营垒》而奠定了现偶男神的地位,并在春晚这一顶级舞台上不期而遇。这一次,宋威龙的黑『风衣』杀与『白敬亭』的西装白衬衫造型,不仅是两位现偶男神美学的巅峰对决,也再次…

宋威龙黑『风衣』vs『白敬亭』西装杀,谁是现偶男神顶流?(宋威龙时尚大片)

『周迅』参加巴黎『时装周』,两名白人壮汉为她撑伞!她对养老有规划(『周迅』巴黎电影节影后照片)

尽管当天的巴黎天气晴朗,没有丝毫降雨或强烈的阳光,主办方仍特意安排了这两名高大男子为她撑伞,只为营造出更加隆重和气派的氛围,完美衬托她的女王风范。婚后,高圣远离开美国定居北京,然而,由于文化背景差异和彼此的性…

『周迅』参加巴黎『时装周』,两名白人壮汉为她撑伞!她对养老有规划(『周迅』巴黎电影节影后照片)