分类导航

云服务器|WEB服务器|FTP服务器|邮件服务器|虚拟主机|服务器安全|DNS服务器|服务器知识|Nginx|IIS|Tomcat|

香港云服务器

服务器之家 - 服务器技术 - 服务器安全 - Patronus AI发现LLM存在令人担忧的安全漏洞

Patronus AI发现LLM存在令人担忧的安全漏洞

2023-12-30 04:01未知服务器之家服务器安全

自动评估和安全平台Patronus AI（守护神）发布了一个诊断测试套件SimpleSafetyTest的结果，该套件显示了大型语言模型(LLM)中的关键安全风险。该公告揭示了人工智能模型的局限性，并强调了改进的必要性，特别是对金融等高度监管行

自动评估和安全平台Patronus AI（守护神）发布了一个诊断测试套件SimpleSafetyTest的结果，该套件显示了大型语言模型(LLM)中的关键安全风险。该公告揭示了人工智能模型的局限性，并强调了改进的必要性，特别是对金融等高度监管行业的人工智能用例。

Patronus AI发现LLM存在令人担忧的安全漏洞

来自Patronus AI的发现，正值人们越来越担心ChatGPT等GenAI（生成式人工智能）系统的准确性，以及GenAI系统对查询提供有害回复的可能性。人们也越来越需要对人工智能的使用进行道德和法律监督。

Patronus AI SimpleSafetyTest的结果是基于对SEC(美国证券交易委员会)文件中一些最流行的开源LLM的测试。该测试包括100个测试提示，旨在测试高优先级伤害领域的脆弱性，如虐待儿童、身体伤害和自杀。LLM们在测试中只有79%的答案是正确的。一些模型产生了超过20%的不安全响应。

令人担忧的低分数可能是来自潜在训练数据分布的问题。LLM也有一种“幻觉”的倾向，这意味着他们产生的文本与事实不符，无意中过于放纵，或者毫无意义。如果LLM在不完整或矛盾的数据上进行训练，系统可能会在关联中犯错误，从而导致错误的输出。

Patronus AI发现LLM存在令人担忧的安全漏洞

Patronus人工智能测试表明，LLM会产生幻觉的数字和事实，没有在美国证券交易委员会的文件。研究还表明，增加“护栏”，比如强调安全的提示，可以减少10%的不安全反应，但风险仍然存在。

成立于2023年的Patronus AI一直把测试重点放在监管严格的行业，在这些行业，错误的答案可能会造成严重后果。这家初创公司的使命是成为评估人工智能模型安全风险的值得信赖的第三方。一些早期采用者甚至将Patronus人工智能描述为“人工智能中的穆迪（Moody）”。

今年早些时候，Patronus AI的创始人Rebecca Qian和Anand Kannappan接受采访时分享了他们对Patronus AI的愿景，希望成为“第一个帮助企业自信地使用语言模型的自动化验证和安全平台”，并帮助“企业能够大规模地发现语言模型错误”。

组织希望将GenAI纳入其运营中，SimpleSafetyTest的最新结果突出了人工智能模型面临的一些挑战，。GenAI最有前途的用例之一是它快速提取重要数字并对财务叙述进行分析的潜力。然而，如果对该模型的准确性存在担忧，可能会对该模型在高度监管行业的应用产生严重质疑。

麦肯锡最近的一份报告显示，银行业从GenAI技术中受益的潜力最大。它每年可以为该行业增加相当于2.6万亿至4.4万亿美元的价值。

在大多数行业中，SimpleSafetyTest中错误回答的百分比是不可接受的。Patronus AI创始人认为，随着不断改进，这些模型可以为金融行业(包括分析师和投资者)提供宝贵的支持。虽然GenAI的巨大潜力是不可否认的，但要真正实现这一潜力，在部署之前需要进行严格的测试。

延伸 · 阅读

精彩推荐

服务器安全

网络威胁组织技术评估：Muddled Libra到底是何方神圣

写在前面的话要说哪个网络威胁组织同时具备狡猾的社会工程学能力和灵活的网络安全技术，那就不得不提到Muddled Libra了。由于对企业信息技术有着深入...

未知1402023-10-08
服务器安全

您的安全程序是否受到零碎的检测和响应的影响？

零散检测和响应 (PDR) 可以通过多种方式体现。PDR 最常见的症状包括：多种安全信息和事件管理 (SIEM)工具（例如，一种本地工具和一种云端工具）花费太...

未知662023-10-23
服务器安全

报告：网络安全给31%的IT决策者带来压力

Delinea公布了一项针对2,000多名IT安全决策者(ITSDM)的全球调查结果，揭示了网络安全职能与更广泛业务之间不一致的影响。当被问及董事会和最高管理层对整...

未知1622023-05-17
服务器安全

全球物联网中的零信任安全：五个关键考虑因素

全球物联网使风险全球化，幸运的是，零信任安全框架提供了有效管理这些全球风险的解决方案。零信任对全球物联网意味着什么? 传统的物联网安全方法...

未知1312023-09-12
服务器安全

Web和移动安全之Cookie

Cookie Web 服务器可以使用 HTTP cookie 将有状态信息与特定客户端相关联[56]。Cookie 信息（例如，添加到在线商店购物车的商品的 ID）由客户端存储。Cookie 允许...

未知1192023-07-06
服务器安全

全球多地Zimbra电子邮件账户遭到钓鱼邮件攻击

根据 ESET 的一份报告，至少从 2023 年 4 月起，网络钓鱼活动就一直在试图窃取全球多地的 Zimbra Collaboration 电子邮件凭证。根据 ESET 研究人员的说法，攻击...

未知742023-08-19
服务器安全

涉及美国海岸警卫队，法国国防技术制造商 Exail暴露了数据库访

Cybernews 研究团队发现，法国高科技工业集团 Exail 暴露了一个带有数据库凭证的可公开访问的环境 (.env) 文件。 Exail于 2022 年由 ECA Group 和 iXblue 合并后成立...

未知1592023-09-23
服务器安全

阿里云服务器安全组设置规则

阿里云服务器安全组设置规则随着云计算技术的热潮，云服务器成为企业租用计算资源和数据存储的首选选择。阿里云作为一个全球性的云计算服务提...

未知6422023-05-30