评估预部署AI模型的可靠性

基础模型是由众多深度学习模型构成的,这些模型在大量通用的未标记数据上进行了预训练。它们能够被应用于多种任务,例如生成图像或解答客户咨询。...

基础模型是由众多深度学习模型构成的,这些模型在大量通用的未标记数据上进行了预训练。它们能够被应用于多种任务,例如生成图像或解答客户咨询。

然而,作为ChatGPT和DALL-E等强大人工智能工具的核心,这些模型有时可能会提供错误或误导性的信息。在一些安全至关重要的场景中,比如行人接近自动驾驶汽车时,这些错误可能会导致严重后果。

为了避免此类错误,麻省理工学院及其IBM沃森人工智能实验室的研究人员开发了一种技术,能够在将基础模型应用于特定任务之前评估其可靠性。

他们通过训练一组略有不同的基础模型来实现这一目标。接着,他们利用算法评估每个模型在相同测试数据点上的学习表示的一致性。如果表示一致,便意味着该模型是可靠的。

在与最先进的基线方法进行比较时,他们的技术在捕捉各种分类任务中基础模型的可靠性方面表现更佳。

这种技术可以帮助用户判断一个模型是否适合特定环境,而无需在现实世界的数据集上进行测试。这在某些情况下尤其有用,例如医疗保健环境中,由于隐私问题可能无法访问数据集。此外,该技术还可以根据可靠性分数对模型进行排序,帮助用户选择最适合其任务的模型。

“所有模型都有可能出错,但能够识别出何时出错的模型更具实用性。对于这些基础模型而言,量化不确定性或可靠性变得更加复杂,因为它们的抽象表示难以进行比较。我们的方法可以帮助量化模型在特定输入数据下的可靠性,”资深作者Navid Azizan表示,他是麻省理工学院机械工程系和数据、系统与社会研究所(IDSS)的助理教授,同时也是信息与决策系统实验室(LIDS)的成员。

他与第一作者Young-Jin Park(LIDS研究生)共同撰写了关于这项工作的论文,参与者还包括麻省理工学院-IBM沃森人工智能实验室的研究科学家王浩,以及Netflix的高级研究科学家谢尔文·阿德希尔。该论文将于人工智能不确定性会议上发表。

统计共识

传统的机器学习模型通常被训练来执行特定任务,通常会根据输入做出具体预测。例如,模型可能会判断某张图片中是猫还是狗。在这种情况下,评估可靠性可能仅需查看最终预测结果,判断模型是否正确。

然而,基础模型的工作方式有所不同。它们使用通用数据进行预训练,创建者并不清楚模型将应用于哪些具体下游任务。用户在训练完成后可以让模型适应自己的特定需求。

与传统机器学习模型不同,基础模型不会给出“猫”或“狗”这样的具体标签,而是基于输入数据生成抽象表示。

为了评估基础模型的可靠性,研究人员采用了一种集成方法,训练多个具有相似特征但略有不同的模型。

“我们的思路类似于计算共识。如果所有基础模型对数据集中的任何数据都给出一致的表示,那么我们可以认为该模型是可靠的,”Park表示。

但他们面临一个挑战:如何比较这些抽象表示?

他补充道:“这些模型输出的是一个由数字组成的向量,因此我们无法轻易比较它们。”

他们通过一种称为邻域一致性的概念来解决这个问题。

在他们的方法中,研究人员准备了一组可靠的参考点来测试模型集合。然后,他们对每个模型在其表示的测试点附近的参考点进行调查。

通过观察相邻点的一致性,他们能够估计模型的可靠性。

对齐表示

基础模型在所谓的表示空间中映射数据点。我们可以将这个空间视为一个球体。每个模型将相似的数据点映射到其球体的同一区域,因此猫的图像会集中在一个地方,而狗的图像则在另一个地方。

然而,每个模型在其领域内绘制的动物地图可能不同,因此当猫可能被分组在一个球体的南极时,另一个模型可能在北半球的某个位置绘制猫的地图。

研究人员使用邻近点作为锚来对齐这些球体,从而使表示具有可比性。如果一个数据点的邻居在多个表示中一致,那么我们可以对该点的模型输出的可靠性充满信心。

在对广泛的分类任务进行测试时,他们发现这种方法比基线方法更具一致性。此外,它不会因为挑战测试点而导致其他方法失效。

此外,他们的方法可以用于评估任何输入数据的可靠性,因此可以评估模型对特定类型个体(例如具有某些特征的患者)的效果。

王表示:“即使所有模型的整体性能处于平均水平,从个体的角度来看,你也会更倾向于选择最适合自己的模型。”

然而,一个限制在于他们必须训练一个大型基础模型的集合,这在计算上是昂贵的。未来,他们计划寻找更高效的方法来构建多个模型,或许可以通过对单个模型进行小扰动来实现。

本文来自作者[svs]投稿,不代表立场,如若转载,请注明出处:http://nelsonebo.net/post/5398.html

(269)

文章推荐

  • 2024年08月29日 星期四 A03版:A03详细报道

    宋代“名学”的新视角  包佳道(图片来源网络,侵删)  在研究宋代的“名学”时,我们常常发现,过去的学者对这一领域关注不多,甚至有些贬低。比如,胡适主要关注先秦的“名学”,对宋代的程朱“格物”方法只字不提,认为它缺乏系统性,只停留在伦理和政治哲学的层面。虞愚在《中国名学》中也只提到程颐和朱子

    2024年09月04日
    860
  • 烟台地区朗逸降价信息!底价6.5万,错过就没有,抓住机会省钱购车!

      欢迎来到汽车之家烟台优惠促销频道!今天我们要聊聊烟台地区的汽车市场动态,特别是那些让人心动的优惠活动。现在,朗逸这款热销车型正在进行一场空前的优惠盛宴,最高优惠竟然可以达到4万元!这意味着,您可以用更少的钱,体验到这款车的魅力。最低起售价格已经调整到6.5万元,真是个购车的好机会!如果您对朗逸感

    2024年09月06日
    777
  • 哈马斯与以色列军队交战,为什么人质交易的报道被否认?

        目击者表示,哈马斯武装分子在周日与以色列军队展开激烈交火,试图进入加沙最大的难民营。以色列对加沙南部实施空袭,导致数十名巴勒斯坦人遇难。美国媒体关于人质释放协议即将达成的消息被否认。  《华盛顿邮报》周日援引知情人士的说法称,美国调解人员接近达成以色列与哈马斯之间的协议,计划

    2024年09月30日
    820
  • Debjani Singh:利用数据推动清洁能源与可持续发展

      在过去的五年里,DebjaniSingh致力于提升HydroSource公司的数字平台,这是一个提供水电数据、分析工具和可视化功能的公共门户。图片来源:CarlosJones/ORNL,美国能源部DebjaniSingh的职业生涯就像她和她的团队精心绘制的河流和小溪一样,充满了曲折

    2024年11月13日
    337
  • 28名毛派分子在丹特瓦达遭遇致命袭击

      在恰蒂斯加尔邦的丹特瓦达地区,周五发生了一起冲突,导致至少28名毛派分子被安全部队击毙。事件发生在Narayanpur与Dantewada地区交界的Abujhmad森林,时间大约在中午12点30分至1点之间,现场还发现了大量武器和弹药,包括AK-47步枪和单反相机。  巴斯塔尔靶场的警察总监

    2024年11月20日
    357
  • 德克萨斯人挑战维京人,钢人主场迎战充电器,NFL不败之路

    新星四分卫C.J.斯特鲁德带领休斯顿德州人队前往明尼苏达,而洛杉矶闪电队则将在周日与匹兹堡展开两支NFL不败球队之间的较量。在赛季的第三周,德克萨斯人队迎来了自2016年以来的首次2-0开局,面对的是以11名四分卫封杀领先NFL的维京人队。维京

    2024年11月24日
    272
  • 卡拉格与内维尔就德克兰·赖斯的看法产生分歧——‘评价过于苛刻’

      卡拉格对前曼联球星加里·内维尔对德克兰·赖斯作为后腰有局限性的看法提出质疑。赖斯在职业生涯中曾在西汉姆和阿森纳扮演多种角色,甚至在铁锤帮担任中后卫。他还曾是英格兰队的双中场球员,最引人注目的是自2023年以1.05亿英镑加盟阿森纳以来,有时会踢后腰和前腰。在阿森纳对阵布莱顿的比赛

    2024年11月24日
    240
  • 芬兰森林微生物提取物被发现具有治愈湿疹的潜力

      芬兰广阔的绿色森林以恢复元气而闻名。它们具有很强的恢复力,甚至可以治疗疾病。这是一家总部位于赫尔辛基的生物技术公司UuteScientific给出的结论。该公司发明了一种独特的疗法:一种复制芬兰自然的微生物提取物。今天,这家初创公司公布了这种生物力量的新

    2024年11月26日
    253
  • 部长宣布,沙巴托儿中心将强制安装闭路电视以应对近期虐待事件

      在哥打京那巴鲁,8月10日——由于最近在一所托儿中心发生的虐待事件,沙巴州政府决定要求所有州内的幼儿园和日托机构在其营业场所安装闭路电视(CCTV),以便在续办营业执照时符合规定。  国家社区发展和人民福利部长拿督詹姆斯拉提表示,相关部门将在明天之前召集所有幼儿园和托儿中心,传达对此事件的关

    2024年11月27日
    253
  • Josh Levy加入amplify担任经理

      独家报道:乔什·列维已于今年早些时候加入了由亚当·列文、布兰迪·里弗斯和迈克尔·赫本创办的管理与制作公司amplify,担任文学经理一职。这一决定使列维与列文、里弗斯和赫本重新聚首,他们曾是他在工业娱乐公司的同事。在过去的八年中,他一直在该公司担任经理,负

    2024年12月13日
    147

发表回复

本站作者后才能评论

评论列表(4条)

  • svs
    svs 2024年12月01日

    我是的签约作者“svs”!

  • svs
    svs 2024年12月01日

    希望本篇文章《评估预部署AI模型的可靠性》能对你有所帮助!

  • svs
    svs 2024年12月01日

    本站[]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • svs
    svs 2024年12月01日

    本文概览:基础模型是由众多深度学习模型构成的,这些模型在大量通用的未标记数据上进行了预训练。它们能够被应用于多种任务,例如生成图像或解答客户咨询。...

    联系我们

    邮件:@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们