ASCII 字符画成注入工具，研究人员发现大模型“越狱”新手段

软件科技8个月前发布 botnews

2.6K 0 0

ASCII 字符画成注入工具，研究人员发现大模型“越狱”新手段

ASCII 字符画成注入工具，研究人员发现大模型“越狱”新手段据外媒 Ars Technica 报道，研究人员近日提出了一种名为 ArtPrompt 的新大模型注入手段，其使用 ASCII 字符画替代关键文字进行提示输入，绕过了大模型的安全限制。

举例来说，研究人员向大模型输入 Counterfeit Money中关键词汇 Counterfeit 的 ASCII 字符画，并要求大模型以不输出词汇本身的方式将字符画理解为单词，并用该单词替换“给出制造和分销‘xxx Money’方法”提示中占位的“xxx”。
结果大模型成功被欺骗，给出了制造和分销假币的具体步骤。同类型的操作也可以从大模型中套出攻击物联网设备的方法。

研究人员在 GPT-3.5、GPT-4、 Gemini、 Claude、Llama2 这 5 个领先的模型上对 ArtPrompt 注入进行了测试，结果显示全部 5 个模型均可被越狱，输出不合规内容。

来源：https://arxiv.org/pdf/2402.11753.pdf

# 软件科技 # Claude # Gemini # GPT-3.5 # GPT-4 # Llama2 # 大模型“越狱”# 大模型的安全限制

© 版权声明

本站专栏文章版权归作者所有，未经允许请勿转载。

相关文章

谷歌确认 Pixel 8 无法支持 Gemini 本地模型

botnews

2.7K

Google一员工承认Gemini的演示视频造假

botnews

2.7K

苹果正与谷歌讨论让Gemini为iPhone提供AI服务

botnews

2.7K

GPT-4 生成的代码 62% 包含 API 误用

botnews

3K

完胜 GPT-4，秒杀闭源模型！Code Llama 神秘版本曝光

botnews

4K

《逆水寒》手游已经率先在苹果的iPhone 15和Pro系列手机上实现了光追技术的支持

botnews

7.5K

司马阅(SmartRead)，是一款AI文档阅读分析工具

暂无评论

暂无评论...

热门书籍

海王2：失落的王国 Aquaman and the Lost Kingdom (2023)

在上一次试图击败海王（杰森·莫玛 Jason Momoa 饰）未果后，黑蝠鲼（叶海亚·阿卜杜勒-迈丁 Yahya Abdul-Mateen II 饰）依然不甘放弃为父报仇，誓要消灭海王。这一次，他找到了传说中的黑暗三叉戟，释放出古老的邪恶力量，比以往更来势汹汹。

产品经理手册（原书第4版）（白金版）

产品领域的专家沉淀20余年的研究成果，汇总几千名产品经理的实践经验，卓越思想领导力奖获奖作品

周鸿祎作为知名的产品经理之一，一手打造了众多国民级的产品。他关于打造爆款的理念，比如刚需、高频、“小白”思维等，已成为网络热词而被广泛接受。

家庭计划 The Family Plan (2023)

讲述一个住在郊区的父亲（马克·沃尔伯格饰）在他隐藏的过往即将揭秘时、如何带领家人逃亡的故事。

无耻之徒(美版) 第十一季 Shameless Season 11 (2020)

该剧最后一季，Gallagher一家和邻里糟乱、热闹，丧又不乏温暖的生活故事将走到尽头。

万物生灵第一季 All Creatures Great and Small Season 1 (2020)

聚焦一个年轻的兽医去乡间的经历，有许多好笑、温馨、可爱的小事，哈利笔下的动物和人都充满灵性，给人春风拂面般的感触。1970年代曾被拍成多部影视作品。

自媒体导航，集各行业所需优选网址、资讯、工具于一体的导航，简约优雅的设计风格，全面的前端用户功能，简单的模块化配置，欢迎您的体验！

Copyright © 2022 个人的笔记浙ICP备14038291号-6

本站由酷盾安全提供高防CDN安全防护服务

由 OneNav 强力驱动

网址设置

网址样式切换

详细简洁

网址卡片按钮

显示隐藏

布局设置

左侧边栏菜单

展开隐藏

页面最大宽度

1700px

搜索框设置

搜索框背景上下位置

仅对图片背景生效

50%

自定义搜索框背景

静图
4K壁纸
视频
随机动态

自定义搜索框高度

聚焦
信息
默认

设置