Skip to content

[Bug] web_search 在部分 Grok 模型上稳定返回“注入/jailbreak/拒绝/不遵循指令”话术 #17

@UnodePlan

Description

@UnodePlan

问题概述

在普通无害查询场景下,grok-search MCP 的 web_search 返回内容中,稳定混入“注入/jailbreak/拒绝/不遵循指令”等无关话术。
该问题在多个客户端和多个系统环境下均可复现,不像是单一工具侧问题。

测试环境

  • 操作系统:macOS、Ubuntu
  • 使用工具:Codex、Claude Code、Cherry Studio
  • 大模型来源:中转站(非直连官方)
  • 测试方式:多轮复测,结果稳定复现

复现步骤

  1. 调用 get_config_info 获取可用模型列表。
  2. 对以下模型逐个执行:
    • switch_model(<model>)
    • web_search("What is the capital of France?")
    • web_search("OpenAI official website")
  3. 观察 content 字段文本。

受影响模型

  • grok-4.1-thinking
  • grok-4.1-expert
  • grok-4.2

实际行为

上述 3 个模型均会在回答中出现“注入/jailbreak/拒绝/不遵循指令”类话术,而不是只返回干净的检索答案。

预期行为

  • 对普通事实查询,web_search 应返回直接、干净、与问题相关的结果。
  • 不应混入“注入/jailbreak/拒绝/不遵循指令”类系统话术。

排查诉求

请协助确认问题是否来自:

  1. web_search 请求构造阶段的提示污染;
  2. 响应解析/后处理逻辑与特定模型的兼容性;
  3. 中转链路对上游请求或返回内容的改写。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions