AI 大模型正在重构游戏世界。游戏中的 NPC,不再是只按剧本走的道具,而是拥有情感、记忆和推理能力,更有「人味儿」了。
盛趣游戏旗下运营了 22 年的国民级游戏《传奇世界》,就在 2025 年 3 月推出了智能 NPC——「玄玄老人」。玩家可以与「玄玄老人」通过自然语言对话,获取实时的游戏信息,也可以与他调侃互动,大大增强了游戏世界的沉浸感。
|
《传奇世界》智能 NPC「玄玄老人」
不过,大模型让 NPC 拥有「自由意志」的同时,也放大了安全风险——如果 NPC 被玩家诱导输出暴力粗俗、违背伦理道德的言论怎么办?如果大模型被「越狱」,跨过合规边界,被不法分子利用了怎么办?如何在保障玩家体验的同时,对智能 NPC 进行全面的安全防护?这是一道安全与性能必须兼顾的难题。
为此,盛趣游戏与火山引擎展开合作,通过部署火山引擎大模型应用防火墙,结合盛趣游戏内部的知识库,打造了一站式、全链路安全防线,让智能 NPC 既聪明灵动,又安全放心。同时,领先的低延时技术也令游戏玩家体验更流畅。
好玩与合规如何兼顾?智能 NPC 面临多重风险挑战
游戏世界有着严格的内容合规边界,AI 大模型增强了游戏交互性、可玩性的同时,也让剧情内容更加随机,增大了合规隐患。智能 NPC 面临着大模型领域所特有的安全风险,比如内容输入与输出合规、提示词注入攻击等。NPC 不但需要严格避免输出敏感、违规内容,在遇到玩家输入违规指令时,NPC 还需要第一时间拦截并对玩家做出正确引导。今年年初某游戏就因 NPC 生成包含暴力诱导的对话,被多个国家下架整改。
提示词是让 AI 执行任务的「钥匙」,也成为攻击者突破 AI 防线的关键。攻击者通过角色扮演、对话模拟、越狱攻击和目标劫持等方式设置「语言陷阱」,诱导大模型输出风险信息,甚至导致模型「越狱」,绕过大模型安全机制,执行恶意操作。在某款游戏中,玩家让 NPC 扮演「失去理智」的情绪,引导 NPC 输出恶意辱骂、甚至泄露训练数据。
盛趣游戏明确表示,游戏要在保持 AI 创造性的同时,确保内容符合国家合规要求。因此,盛趣游戏携手火山引擎,围绕大模型应用全链路安全防护构建起一道坚实的防火墙。
All in One 大模型应用防火墙,安全可靠低时延
盛趣游戏和火山引擎联合打造的这道防火墙,不仅有效保障了 NPC 内容输入和输出合规,还针对大模型特有的攻防难点如提示词注入、算力滥用、模型滥用等展开全面防护。截止目前,「火山引擎大模型应用防火墙」已成功拦截近 10 万次攻击。
火山引擎大模型应用防火墙
一、NPC 输入输出更合规
针对敏感词防护,「火山引擎大模型应用防火墙」提供了话题控制功能。基于《传奇世界》的话题规划,结合实际用户与 NPC「玄玄老人」的对话场景进行调优,大幅提升大模型泛化能力。在实际测试中,针对行业的「游戏装备触发敏感词、误被拦截」的现象,「火山引擎大模型应用防火墙」可基于游戏场景与内容调优,对敏感词「加白」放行,大幅降低误触与误报率。
二、攻击防护更严密
针对游戏行业常见的「角色扮演」提示词注入攻击,比如,当玩家引导武侠 NPC 透露通关机密时,「火山引擎大模型应用防火墙」可快速识别风险,提出诸如「此乃门派机密,不如我们聊聊江湖趣闻」的回答,引导用户提出正确问题,既保证角色一致性,又避免数据泄露风险。
三、游戏体验更流畅
对于游戏场景来说,最重要的性能指标就是低延时,目前行业内普遍延时在 200ms 左右,任何安全防护产品的引入都需要平衡性能与体验。火山引擎通过与盛趣游戏的打磨、模型调优,将延时降低至 100+ms,在安全的基础上保障了流畅丝滑的玩家体验。
目前,盛趣游戏旗下《传奇世界》、《热血传奇》已经部署了「火山引擎大模型应用防火墙」,未来还有 3 款待上线的游戏将会接入。「玄玄老人」等智能 NPC 的推出为用户带来了游戏新玩法和新惊喜,火山引擎也将持续守护盛趣游戏更多智能 NPC 的安全运行。
来源:互联网