大型数据集可纠正AI在视觉任务中的偏见(数据集过大)

据最新一期《自然》发表的研究,科学家建立了超过一万张人类图像的数据库,以评估并纠正人工智能(AI)模型在视觉领域存在的偏见。这一“公平的以人类为中心的图像基准”(FHIBE)由索尼AI开发,采用符合伦理手段获取、基于用户同意的数据集,可精确评估以人为中心的计算机视觉任务,从而识别、纠正偏见和刻板印象。团队认为,这是迈向更可信AI的重要一步。

计算机视觉广泛应用于自动驾驶车辆、面部识别等技术领域。许多计算机视觉使用的AI模型,其训练数据存在缺陷,可能未经同意收集,经常来自网络大规模图像抓取。人们也发现,AI模型可能会反映出延续性别歧视、种族歧视或其他刻板印象的偏见。

此次,研究团队构建了一个图像数据集,在同意机制、多样性和隐私等多方面采取了最佳实践。FHIBE包含81个国家和地区中1981名个体的10318张图像。该数据库包括了人口统计和生理特征的全面标注,包括年龄、代词类别、祖先血统、发色与肤色等。参与者获得了关于项目和潜在风险的详细信息,帮助他们做出知情同意,过程符合全面数据保护法规。这些特征使该数据库成为评估AI偏见的可靠资源。

团队将FHIBE和27个现有以人类为中心的计算机视觉应用数据集做了比较,发现FHIBE数据集在多样性与AI评估的可靠同意方面标准更高。它还有效减少了偏见,包含的参与者自我申报标注信息超过其他数据集,还包括了相当比例通常代表性不足的人群。该数据集可用于评估现有的AI模型在计算机视觉任务中的表现,能揭示更多此前无法了解的偏见。

不过,团队也承认,目前创建数据集的过程充满挑战且成本十分高昂。

【总编辑圈点】

本报近期推出了多篇关于AI易出现偏差与其尚不可靠的相关报道。本文的这项研究,则是一次对AI伦理建设具有标杆意义的实践。它最核心的价值在于,将“公平”这一抽象原则,转化为一套可操作、可验证的技术标准与工作流程。AI的偏见已经是行业顽疾,但现在可能有了一把标准量尺,使得量化评估与比较不同模型的公平性成为可能,这将直接推动算法的研发与优化。尽管其高昂成本提示了推广的难度,但这一探索本身,正是推动AI从单纯追求性能强大,转向值得人类托付之伙伴的关键点。(记者张梦然)

特别声明:[大型数据集可纠正AI在视觉任务中的偏见(数据集过大)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

末日逃生2:迁移》预售炸裂开启!解锁末日生存新范本(《末日逃生2:迁移》在线观看)

更有CINITY和中国巨幕版本上映,沉浸式穿越欧洲冰封废土,辐射☢️风暴、陨石雨冲击,末日生存体验感直接拉满,每一幕都突破感官极限,开启一场无与伦比的光影盛宴! 最新预告中,灾难场面全面升级,风暴冲击波席卷而来,…

《<strong>末日逃生2:迁移</strong>》预售炸裂开启!解锁末日生存新范本(《<strong>末日逃生2:迁移</strong>》在线观看)

高端轻奢掐丝珐琅彩艺术玻璃屏风,如何打造2026现代简约客厅入户正对门半墙亮点?(掐丝珐琅什么意思)

想要让现代简约客厅更有品质感?掐丝珐琅彩艺术玻璃屏风是高端轻奢的选择。这篇文章从入户屏风的功能需求、预算考量、设计搭配等方面,帮助你打造客厅入户半墙的独特视觉焦点,避免踩坑!

高端轻奢掐丝珐琅彩艺术玻璃屏风,如何打造2026现代简约客厅入户正对门半墙亮点?(掐丝珐琅什么意思)

陆嫣遭文鹏绑架命悬一线,江成屹要如何营救?(陆嫣资料)

文鹏潜入医院,将陆嫣掳走并囚禁于一处隐秘的湖边小屋。当江成屹赶到时,却看见文鹏将自己与陆嫣紧紧绑在一起,站在湖边,随时准备跃入湖水之中。文鹏对陆嫣的执念越来越深 希望陆嫣能够接受他的爱 他想让江成屹亲眼看…

陆嫣遭文鹏绑架命悬一线,江成屹要如何营救?(陆嫣资料)

讲一个女海王被圈内大佬欺负的瓜(海王 女主角🎭️)

今天要说的这位女星,她的故事与车速有关,她是内娱圈的女海王,这位女海王不仅有外表的优势,还有能歌善舞的才华,但她却也因一连串的错失机会,最终沦为资本的弃子,被大佬们一次次地欺负。在与大佬的解约官司尚未结束时,…

讲一个女海王被圈内大佬欺负的瓜(海王 女主角🎭️)

【市民开放日】您的阅读心愿,我们来倾听!(城市开放时间)

书香浸润心灵,服务贴近需求。为全面推进2026年“品质提升年”走深走实,进一步优化潍坊市图书馆的服务体验,丰富馆藏资源,打造更舒适、更智能、更贴心的阅读空间,我们精心设计了《潍坊市图书馆读者阅读需求调查问卷》…

【市民开放日】您的阅读心愿,我们来倾听!(城市开放时间)