英国人工智能安全研究所推出人工智能模型安全测试工具平台

  发布时间:2025-12-07 19:45:08   作者:玩站小弟   我要评论
英国人工智能安全研究所(AI Safety Institute)推出了一个新平台,允许企业在公开发布人工智能模型之前对其进行测试。这个名为Inspect的平台是一个软件库,旨在评估人工智能模型的能力, 。

英国人工智能安全研究所(AI Safety Institute)推出了一个新平台 ,英国研究允许企业在公开发布人工智能模型之前对其进行测试。人工

这个名为Inspect的安全平台是一个软件库 ,旨在评估人工智能模型的所推试工能力,在推理和自主能力等方面对它们进行评分 。出人

目前,工智开发人员缺乏可用的型安安全测试工具 。上个月,全测MLCommons发布了一个大型的具平以语言模型为重点的安全测试基准  。

Inspect就是英国研究为了填补这一空白而开发的建站模板,它是人工开源的 ,所以任何人都可以用它来测试他们的安全人工智能模型 。

企业可以使用Inspect来评估人工智能模型和外部工具使用的所推试工提示工程。该工具还包含包含标记样本的出人评估数据集 ,因此开发人员可以详细检查用于测试模型的工智数据 。

它被设计为易于使用  ,并提供了用于运行整个过程中提供的各种测试的解释器,服务器租用包括模型是否托管在AWSBedrock等云环境中。

安全研究所表示,开放测试工具的决定将使全球的开发人员能够进行更有效的人工智能评估。

英国科技大臣MichelleDonelan表示:“作为英国在人工智能安全方面不断发挥领导作用的一部分,我已批准人工智能安全研究所的测试平台开源我之所以对此充满热情 ,并将Inspect开源,是因为如果我们抓住人工智能的风险 ,我们可以获得非凡的免费模板回报。”

安全研究所表示 ,它计划在未来开发除Inspect之外的开源测试工具 。该机构将在今年4月签署一项联合工作协议后,与美国同行合作开展相关项目。

人工智能安全研究所主席Ian Hogarth表示:“在人工智能安全测试方面的成功合作意味着有一个共享的、可访问的评估方法,我们希望Inspect能成为人工智能安全研究所、研究机构和学术界的基石。我们希望看到全球人工智能社区不仅使用Inspect进行自己的模型安全测试,亿华云而且帮助适应和建立开源平台  ,以便我们能够全面进行高质量的评估。”

OpenUK首席执行官Amanda Brock表示,安全研究所新平台的成功只能通过已经承诺使用该测试工具的公司数量来衡量。

Brock说:“由于英国在监管方面的立场缓慢 ,这个平台必须取得成功 ,英国才能在未来的人工智能领域占有一席之地 。现在所有人的目光都集中在韩国和下一届安全峰会上 ,看看世界是如何看待这一点的香港云服务器。”

Saidot公司首席商务官Veera Siivonen表示 ,“Inspect能够评估广泛的人工智能功能并提供安全评分 ,使各种规模的组织不仅能够利用人工智能的潜力,还能确保负责任地 、安全地使用人工智能 。这是实现人工智能安全民主化的一步,此举无疑将推动创新,同时防范与先进人工智能系统相关的风险 。”

源码下载
  • Tag:

相关文章

  • 2亿Twitter用户的数据被公开,仅需2美元即可下载

    近日,一个包含超过2亿Twitter用户数据的文件在一个流行的黑客论坛上发布,价格约为2美元。 目前,已经证实了泄露中列出的诸多用户数据的有效性。自2022年7月22日以来,攻击者一直在各种在线黑客论
    2025-12-07
  • 开发者的福音 提前为你揭秘2022鲲鹏开发者创享日武汉站

    以“创未来,享非凡”为主题的鲲鹏开发者创享日第二站即将于5月27日在武汉开启。此次大会将分为主论坛、技术演讲、产教融合研讨会以及走进高校四大部分,内容丰富扎实、看点亮点频出!汇聚了技术专家大咖、区域伙
    2025-12-07
  • 聚焦企业核算碳排放需求,联想推出碳核算平台免费试用

    6月14日,主题为“数字化创新加速企业绿色低碳发展”新IT思享会圆满召开。会上,为助力“3060双碳”战略目标实现,以数字化创新推动并加速企业和个人的绿色低碳发展,联想重磅推出了首款“联想企业碳核算平
    2025-12-07
  • 整合全栈服务能力 联想进入福布斯中国数字经济榜单前十

    ​日前,由福布斯中国、中国电子商会联合主办的“2022中国数字经济100强”发布盛典于江西上饶举行。会上,正式发布了2022中国数字经济100强榜单。榜单显示,中国数字经济企业中综合实力表现突出的联想
    2025-12-07
  • MTS性能监控你知道多少

    前言说到MySQL的MTS,相信很多同学都不陌生,从5.6开始基于schema的并行回放,到5.7的LOGICAL_CLOCK支持基于事务的并行回放,这些内容都有文章讲解,在本篇文章不再赘述。今天要讲
    2025-12-07
  • Vivoxplay3手机测评(一部高性价比的智能手机选择,为你带来更多惊喜)

    现如今,智能手机已经成为人们生活中必不可少的工具之一。然而,在众多品牌中选择一款性能稳定、价格合理的智能手机并非易事。今天,我们将为大家带来一款备受好评的手机——Vivoxplay3。本文将从性能、拍
    2025-12-07

最新评论