Roxy AI Agent
提示
Roxy AI Agent 是智能执行型 AI 助手,核心优势是无需复杂代码,只要用日常口语说出需求,就可以让 AI 控制多个浏览器窗口同步执行自动化任务。
开启 AI 自动化之旅
进入 Roxy AI Agent 非常简单。在 RoxyBrowser 客户端右下角,点一下"Roxy AI Agent"就能进入主要的操作界面。

点击后会弹出一个粉蓝渐变背景的界面,这就是你指挥 Roxy AI Agent 的地方了。界面主要包含了任务模板区、指令输入框和状态显示区三大功能区,后续核心操作都是在这里进行。
- 指令输入框:位于界面中部,是向 AI Agent 输入指令的地方。在指令输入框底下左侧,你可以找到一个 "多窗口并行" 开关。如果你需要同时执行多个任务或者给不同任务分配独立的浏览器环境,一定要打开这个开关,这样 AI 会同步打开并控制多个浏览器窗口执行任务。

- 任务模板区:这是打开新会话后默认位于界面中央的功能区,预设了最高频的自动化操作。你只要点击其中的模板选项,就可以在指令输入框里生成相应指令模板,按自己的需求对其加以简单修改即可执行你想要的操作。

- 状态显示区:如果在指令输入框中发送你的指令,任务模板区就会被状态显示区替代。状态显示区会显示你输入过的指令并且返回 AI 运行指令的结果,在呈现结果时可以实时显示出指令执行的每一个逻辑步骤以及每个步骤耗费的时间。
自然语言理解与 AI 自动执行
Roxy AI Agent 最大的突破在于它对 "自然语言即代码" 的实现。你不用学习复杂的 Python 脚本、调试 Selenium 框架,只用输入自然语言作为指令,就可以让 AI 自动完成多账号、多窗口的自动化操作。无论是批量创建环境、平台养号、内容发布还是数据采集,只需描述需求,AI 即可理解并执行。
- 输入指令
在指令输入框中输入你的任务描述,例如"帮我创建 5 个浏览器窗口并配置独立指纹"或"同时在这几个账号里发布准备好的视频内容"。指令可以基于任务模板生成,也可以是完全自定义的自然语言。
- 任务执行
提交指令后,AI 会自动拆解任务逻辑,并同步控制多个浏览器窗口按步骤执行。在任务执行过程中,状态显示区会实时显示 AI 的执行进度,让你清楚完整地看见 AI 正在执行的具体动作及每个步骤的耗时,比如"思考中"、"正在生成内容"、"正在提交表单"等等。
- 查看结果
任务完成后,各窗口会按指令要求完成相应操作,无需你手动逐个账号处理。从环境配置到业务执行,全流程自动化,效率大幅提升。
任务模板深度解析
任务模板区预置了覆盖跨境运营高频场景的模板,新手用户可开箱即用。点击任意模板即可在指令输入框生成对应指令,按需微调后执行。当前支持的模板如下:
| 模板名称 | 适用场景 | 功能说明 |
|---|---|---|
| 创建窗口 | 批量初始化浏览器环境 | 快速设置窗口数量、代理 IP 类型(静态住宅/动态流量)、浏览器指纹版本,省去手动逐一配置的繁琐。 |
| TikTok 养号 | 矩阵账号权重提升 | 自动执行标准化养号流程,模拟真实用户行为(刷视频停留时长、关注互动等),提升账号权重并规避平台检测。 |
| 内容发布 | 多平台批量分发 | 在 TikTok、Instagram 等主流媒体平台批量发布视频或图文,支持预设发布时间、文案及标签,实现内容全自动出海。 |
| 网页爬虫 | 数据采集与整理 | 输入目标网站地址后,AI 自动识别网页结构并完成数据抓取与导出,大幅降低人工采集成本。 |
提示
任务模板库会持续扩充,后续将覆盖更多垂直场景与平台。你也可以直接输入自然语言描述需求,不受模板限制。
MCP 接入
Roxy AI Agent 现已支持接入外部 MCP(Model Context Protocol)服务。通过 MCP,你可以将 AI Agent 与各类外部工具、数据源及第三方服务无缝连接,突破内置能力的边界。
- 自定义 MCP Server:支持配置私有或开源的 MCP 服务端地址,AI Agent 在执行任务时可自动识别并调用对应的工具。
- 动态能力扩展:接入后,AI Agent 的指令理解范围与执行能力将随 MCP 服务实时扩展,实现更复杂的跨系统自动化。
配置入口位于 AI Agent 设置面板,添加 MCP 服务后,在任务指令中直接描述需求即可,AI 会自动判断何时调用外部 MCP 工具完成目标。

MCP 接入方式
Roxy AI Agent 提供三种灵活的 MCP 接入方式,满足不同场景下的配置需求:
1. 命令行(stdio)
适用于本地部署或命令行可直接调用的 MCP 服务。在接入面板中只需填写名称和命令,AI Agent 即会通过子进程启动该命令,通过标准输入输出(stdin/stdout)与 MCP 服务通信。
适用场景:本地脚本、Node.js / Python 等编写的本地 MCP Server。
配置要点:在"命令"输入框中直接填入完整启动命令(包含参数),例如 npx -y excel-csv-mcp-server。
2. HTTP 请求
适用于已部署为网络服务的 MCP Server。AI Agent 通过 HTTP 协议直接向指定的服务端点发送请求,实现远程调用。
适用场景:部署在服务器上的 MCP 服务、云函数、远程 API 等。
配置要点:需填写服务的基础 URL 地址,支持设置自定义请求头(Headers)。
3. 从剪贴板导入 JSON
最快捷的接入方式,支持直接粘贴符合 MCP 规范的 JSON 配置,系统会自动解析并填充所有必填参数。如果你已有现成的 MCP Server 配置(如 Cursor / Claude Desktop 的配置文件),可直接复制 JSON 内容一键导入。
适用场景:快速复用现有配置、从其他客户端迁移 MCP 服务。
配置要点:JSON 格式需符合 MCP 协议规范,通常包含 command、args、env 等字段。
接入示例
以下分别展示三种接入方式的实际配置过程。
1.命令行(stdio)方式
以本地部署的 excel-csv-mcp-server 为例,在"命令"输入框中直接填入完整命令:
npx -y excel-csv-mcp-server- 名称:可自定义,如
excel-csv - 环境变量:如有需要可添加(通常留空即可)
填写完成后点击"验证",确认连通后保存即可。

2.HTTP 请求方式
以下以 DeepWiki MCP 为例。这是一个公开的在线 MCP 服务,无需注册和 API Key,填入 URL 即可直接使用。
配置参数:
| 配置项 | 值 | 说明 |
|---|---|---|
| URL | https://mcp.deepwiki.com/mcp | DeepWiki 公开 MCP 端点(Streamable HTTP) |
| Headers | 无需填写 | 该服务不需要鉴权 |

3.从剪贴板导入 JSON
以 excel-csv-mcp-server 为例,直接复制以下 JSON 配置并粘贴到导入框:
{
"mcpServers": {
"excel-csv": {
"command": "npx",
"args": ["-y", "excel-csv-mcp-server"]
}
}
}系统会自动解析 command 和 args 字段,并以**命令行(stdio)**方式完成接入。

验证效果
无论通过哪种方式接入,配置完成后你都可以通过向 AI Agent 提问来快速确认 MCP 是否已成功生效。在 AI Agent 对话框中输入:
我现在安装了哪些 MCP服务?请把它们列举出来,它们分别有什么作用?
AI Agent 会自动识别当前已接入的所有 MCP 服务,并逐一列出它们的名称和核心功能。例如:
- excel-csv:支持读取和解析 Excel / CSV 文件内容
- DeepWiki:支持查询 7000+ 技术库的文档和开发资料
如果某个 MCP 未正确接入,AI 会提示该服务当前不可用,方便你快速定位并排查配置问题。

Skills 接入
Roxy AI Agent 支持通过 Skills 机制接入外部扩展能力。Skills 是封装好的可复用功能单元,可按需启用,让 AI Agent 快速获得特定领域的专业能力。
- Skills 接入:支持接入官方或社区提供的 Skills,覆盖 SEO 分析、内容生成、数据清洗等垂直场景。
- 与任务模板联动:Skills 可与任务模板组合使用,在标准化流程中嵌入自定义能力,实现更复杂的自动化工作流。
在 AI Agent 设置面板的 Skills 区域,导入Skills文件即可。导入后,AI 会在合适的时机自动调用相关 Skill 辅助任务执行。

会话管理
高效的组织能力是处理高强度多账号运营的秘诀。Roxy AI Agent 提供了极简但强大的会话管理系统,让你轻松管理每一个自动化工作流。
会话删除
- 应用场景:随着业务的更迭,某些会话可能再也用不上了。及时清理会话列表,能让你的操作界面保持最高效的状态,也可以保护你某些任务的隐私。
- 操作方式:鼠标悬浮在左侧历史记录对应会话按钮时,会在右侧弹出 "删除" 选项的按钮,点击 按钮 即可将当前对话完全移除。

历史记录
- 应用场景:这个功能相当于 Roxy AI Agent 的档案库,显示了你过往创建的所有任务会话,方便你回溯其中内容。运用这个功能对于复刻成功的运营流程和排查业务问题具有无可替代的价值。
- 操作方式:会话框左侧为历史记录,可以看到你过往创建的所有任务会话和对应会话的创建时间。点击某个会话就可以切换到这个会话的相应界面。

会话添加
- 应用场景:除了管理你之前的会话外,如果你手上有某个全新的业务逻辑(例如从"TikTok 养号"切换到"亚马逊数据采集"),你往往就要创建新的会话。这种做法能把不同的业务线彻底隔离开来,有效避免指令逻辑的混淆,让 AI 的理解更加精准。
- 操作方式:在旧会话界面的左上角点击新建对话按钮,就会立马生成一个干净的对话界面。

