盛趣游戏携手火山引擎打造大模型防火墙，保障智能 NPC 安全合规-启视百科

AI 大模型正在重构游戏世界。游戏中的 NPC，不再是只按剧本走的道具，而是拥有情感、记忆和推理能力，更有「人味儿」了。

盛趣游戏旗下运营了 22 年的国民级游戏《传奇世界》，就在 2025 年 3 月推出了智能 NPC——「玄玄老人」。玩家可以与「玄玄老人」通过自然语言对话，获取实时的游戏信息，也可以与他调侃互动，大大增强了游戏世界的沉浸感。

盛趣游戏携手火山引擎打造大模型防火墙，保障智能 NPC 安全合规

《传奇世界》智能 NPC「玄玄老人」

不过，大模型让 NPC 拥有「自由意志」的同时，也放大了安全风险——如果 NPC 被玩家诱导输出暴力粗俗、违背伦理道德的言论怎么办？如果大模型被「越狱」，跨过合规边界，被不法分子利用了怎么办？如何在保障玩家体验的同时，对智能 NPC 进行全面的安全防护？这是一道安全与性能必须兼顾的难题。

为此，盛趣游戏与火山引擎展开合作，通过部署火山引擎大模型应用防火墙，结合盛趣游戏内部的知识库，打造了一站式、全链路安全防线，让智能 NPC 既聪明灵动，又安全放心。同时，领先的低延时技术也令游戏玩家体验更流畅。

好玩与合规如何兼顾？智能 NPC 面临多重风险挑战

游戏世界有着严格的内容合规边界，AI 大模型增强了游戏交互性、可玩性的同时，也让剧情内容更加随机，增大了合规隐患。智能 NPC 面临着大模型领域所特有的安全风险，比如内容输入与输出合规、提示词注入攻击等。NPC 不但需要严格避免输出敏感、违规内容，在遇到玩家输入违规指令时，NPC 还需要第一时间拦截并对玩家做出正确引导。今年年初某游戏就因 NPC 生成包含暴力诱导的对话，被多个国家下架整改。

提示词是让 AI 执行任务的「钥匙」，也成为攻击者突破 AI 防线的关键。攻击者通过角色扮演、对话模拟、越狱攻击和目标劫持等方式设置「语言陷阱」，诱导大模型输出风险信息，甚至导致模型「越狱」，绕过大模型安全机制，执行恶意操作。在某款游戏中，玩家让 NPC 扮演「失去理智」的情绪，引导 NPC 输出恶意辱骂、甚至泄露训练数据。

盛趣游戏明确表示，游戏要在保持 AI 创造性的同时，确保内容符合国家合规要求。因此，盛趣游戏携手火山引擎，围绕大模型应用全链路安全防护构建起一道坚实的防火墙。

All in One 大模型应用防火墙，安全可靠低时延

盛趣游戏和火山引擎联合打造的这道防火墙，不仅有效保障了 NPC 内容输入和输出合规，还针对大模型特有的攻防难点如提示词注入、算力滥用、模型滥用等展开全面防护。截止目前，「火山引擎大模型应用防火墙」已成功拦截近 10 万次攻击。

盛趣游戏携手火山引擎打造大模型防火墙，保障智能 NPC 安全合规

火山引擎大模型应用防火墙

一、NPC 输入输出更合规

针对敏感词防护，「火山引擎大模型应用防火墙」提供了话题控制功能。基于《传奇世界》的话题规划，结合实际用户与 NPC「玄玄老人」的对话场景进行调优，大幅提升大模型泛化能力。在实际测试中，针对行业的「游戏装备触发敏感词、误被拦截」的现象，「火山引擎大模型应用防火墙」可基于游戏场景与内容调优，对敏感词「加白」放行，大幅降低误触与误报率。

盛趣游戏携手火山引擎打造大模型防火墙，保障智能 NPC 安全合规