Gemini Nexus

🚀 赋予浏览器原生 AI 灵魂：深度集成 Google Gemini 的全能助手

🌟 项目简介

Gemini Nexus 是一款深度集成 Google Gemini 能力的 Chrome 扩展程序。它不仅仅是一个侧边栏插件，而是通过注入式的悬浮工具栏、强大的图像 AI 处理以及前沿的浏览器控制协议 (MCP)，将 AI 的触角伸向网页浏览的每一个交互细节。

🔧 二开说明

这是基于原项目 yeahhe365/gemini-nexus 的二次开发版本。

与原项目的主要区别

功能新增

新增 Gemini API 与 OpenAI Compatible API 配置链路，支持自定义 Base URL、API Key 与 Model IDs。
新增 Google Search grounding 支持，并在回复中展示联网来源。
新增 侧边栏按标签页显示范围控制，支持减少在不需要标签页中的干扰。
新增 历史用户消息编辑，支持从历史位置重新编辑并继续对话；该能力仅在 API 渠道启用。
新增 上下文管理，支持摘要压缩和最近 N 轮裁剪，降低长会话超过模型上下文的风险。

功能修改

修改外部链接打开行为，聊天中的链接统一在浏览器新标签页打开，避免在侧边栏中加载外站失败。
调整扩展身份与本地升级行为，提升覆盖安装时设置保留与升级稳定性。

修复与优化

修复官方 API 请求中的不兼容参数问题。
修复快捷键匹配在部分异常事件对象上的报错问题。

⚙️ 多驱动核心对比 (services/providers)

项目内置了三种驱动方案，通过代码逻辑动态适配不同的使用场景：

驱动方案	逻辑入口	支持模型	核心优势	使用前提
Web Client	`web.js`	Gemini 3 系列	完全免费，支持联网插件	需保持 Google 账号登录
Official API	`official.js`	Pro/Flash 预览版	极速响应，原生支持 Thinking 模式	需 Google AI Studio Key
OpenAI Compatible	`openai_compatible.js`	GPT/Claude 等	高扩展性，支持中转接口	需第三方服务密钥

🤖 浏览器控制 (MCP) 能力集

基于 background/control/ 模块实现，AI 可以执行复杂的 Agent 任务：

分类	核心指令	代码实现逻辑
导航控制	`navigate_page`, `new_page`	调用 `chrome.tabs` 进行页面生命周期管理
页面交互	`click`, `fill`, `drag`	基于 Accessibility Tree 生成 UID 进行精准操控
数据观测	`take_snapshot`, `get_logs`	实时提取 DOM 结构、控制台日志及网络请求
脚本执行	`evaluate_script`	在网页 Context 中运行自定义 JavaScript

外部 MCP 工具（远程服务器）

Gemini Nexus 可以选择连接到外部 MCP 服务器（通过 SSE、可流式传输的 HTTP 或 WebSocket），并在现有的工具循环（Tool Loop）中执行其工具。

推荐方案：使用本地代理（支持 stdio 服务器）

由于 Chrome 扩展程序无法直接运行基于 stdio 的 MCP 服务器，推荐的设置方案是运行一个本地代理（例如 MCP SuperAssistant Proxy）。在代理中配置您的 MCP 服务器（包括 stdio 服务器），然后将 Gemini Nexus 连接到该代理端点。

常见的代理端点如下：

SSE: http://127.0.0.1:3006/sse
可流式传输的 HTTP: http://127.0.0.1:3006/mcp
WebSocket: ws://127.0.0.1:3006/mcp

设置步骤

启动您的 MCP 代理并在其中配置好 MCP 服务器。
在 设置 (Settings) → 连接 (Connection) → 外部 MCP 工具 (External MCP Tools) 中：
- 启用“外部 MCP 工具” (Enable External MCP Tools)。
- 选择一个活动服务器 (Active Server)（您可以保存多个服务器条目并根据需要切换）。
- 选择传输协议并设置服务器 URL（SSE / 可流式传输的 HTTP / WebSocket）。
- 点击测试连接 (Test Connection) 和刷新工具 (Refresh Tools)。
可选（当工具较多时推荐）：将公开工具 (Expose Tools) 设置为仅限选定工具 (Selected tools only)，然后仅启用您希望模型查看/使用的工具。
开始正常对话；当模型需要使用工具时，它会输出一个如下所示的 JSON 工具块：
```
{ "tool": "工具名称", "args": { "键": "值" } }
```

✨ 核心功能亮点

💬 智能侧边栏：基于 sidePanel API，提供毫秒级唤起的对话空间，支持全文搜索历史记录。
🪄 划词工具栏：注入 Content Script，选中文字即刻进行翻译、总结、重写，支持一键回填表单。
🖼️ 图像 AI 处理：
- OCR & 截图翻译：集成 Canvas 裁剪技术，框选图片区域即刻提取文字并翻译。
- 浮窗探测：自动识别网页图片并生成悬浮 AI 分析按钮。
- 水印消除：内置 watermark_remover.js 算法，显著提升生成图像的可视化质量。
🛡️ 安全渲染：所有 Markdown、LaTeX 公式及代码块均在 sandbox 隔离环境中渲染，确保主页面安全。

🚀 快速开始

安装步骤

从 Releases 下载最新 ZIP 包并解压。
Chrome 访问 chrome://extensions/，右上角开启 “开发者模式”。
点击 “加载已解压的扩展程序”，选择解压后的文件夹即可。

技术栈

构建工具：Vite + TypeScript
架构协议：Chrome MV3 + Browser Control Protocol
核心库：Marked.js, KaTeX, Highlight.js

📄 许可证

本项目基于 MIT License 开源。

Name		Name	Last commit message	Last commit date
Latest commit History 99 Commits
.github/workflows		.github/workflows
.trellis/spec		.trellis/spec
assets		assets
gemini-nexus		gemini-nexus
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Gemini Nexus

🚀 赋予浏览器原生 AI 灵魂：深度集成 Google Gemini 的全能助手

🌟 项目简介

🔧 二开说明

与原项目的主要区别

功能新增

功能修改

修复与优化

⚙️ 多驱动核心对比 (services/providers)

🤖 浏览器控制 (MCP) 能力集

外部 MCP 工具（远程服务器）

推荐方案：使用本地代理（支持 stdio 服务器）

设置步骤

✨ 核心功能亮点

🚀 快速开始

安装步骤

技术栈

📄 许可证

About

Uh oh!

Releases 7

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Gemini Nexus

🚀 赋予浏览器原生 AI 灵魂：深度集成 Google Gemini 的全能助手

🌟 项目简介

🔧 二开说明

与原项目的主要区别

功能新增

功能修改

修复与优化

⚙️ 多驱动核心对比 (services/providers)

🤖 浏览器控制 (MCP) 能力集

外部 MCP 工具（远程服务器）

推荐方案：使用本地代理（支持 stdio 服务器）

设置步骤

✨ 核心功能亮点

🚀 快速开始

安装步骤

技术栈

📄 许可证

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 7

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages