浏览器自动化调度技能

本技能负责将浏览器自动化任务委派给专业的 chrome-devtools-expert agent 执行，通过 agent 隔离来保持主对话上下文的清晰，避免浏览器操作过程中的大量 token 消耗污染主对话。

核心功能

识别需要浏览器自动化操作的场景，并将任务委派给 chrome-devtools-expert agent，该 agent 专门使用 Chrome DevTools MCP 工具进行 Web 界面交互、自动化测试和性能分析。

适用场景

本技能适用于以下场景：

•
页面导航与浏览
- •打开指定 URL 的网页
- •在页面间导航（前进、后退）
- •管理多个浏览器标签页
•
元素交互操作
- •点击按钮、链接等元素
- •悬停在元素上触发效果
- •拖拽元素到指定位置
•
表单填写与提交
- •填写输入框、文本域
- •选择下拉菜单选项
- •提交表单并等待响应
•
页面截图与快照
- •截取整个页面或特定元素
- •获取页面的文本快照
- •保存截图到文件
•
性能分析与测试
- •启动性能跟踪
- •分析页面加载性能
- •获取核心 Web 指标（CWV）
•
自动化测试
- •执行功能测试流程
- •验证页面元素状态
- •检查控制台错误
•
数据采集
- •从网页提取信息
- •执行 JavaScript 获取数据
- •监控网络请求
•
网络与设备模拟
- •模拟不同网络条件
- •模拟 CPU 性能限制
- •调整页面尺寸

调用规则

1. 委派方式

使用 Task tool 调用 chrome-devtools-expert agent：

code

Task tool 参数：
- subagent_type: "chrome-devtools-expert"
- description: 简短描述任务（3-5个字）
- prompt: 详细的操作需求和目标

场景示例

示例 1：打开页面并截图

用户需求: "打开 example.com 并截图"

执行方式:

code

调用 Task tool:
- subagent_type: "chrome-devtools-expert"
- description: "打开页面并截图"
- prompt: "打开 https://example.com，等待页面加载完成后截图，将截图保存到桌面"

示例 2：表单自动化

用户需求: "帮我填写这个登录表单并提交"

执行方式:

code

调用 Task tool:
- subagent_type: "chrome-devtools-expert"
- description: "填写登录表单"
- prompt: "在当前页面找到登录表单，填写用户名'test@example.com'，密码'password123'，然后点击登录按钮，等待响应并告诉我是否成功"

示例 3：性能分析

用户需求: "分析这个页面的加载性能"

执行方式:

code

调用 Task tool:
- subagent_type: "chrome-devtools-expert"
- description: "页面性能分析"
- prompt: "对 https://example.com 进行性能分析，启动性能跟踪，刷新页面，停止跟踪，提供核心 Web 指标和性能洞察"

示例 4：自动化测试

用户需求: "测试购物车添加商品的功能"

执行方式:

code

调用 Task tool:
- subagent_type: "chrome-devtools-expert"
- description: "测试购物车功能"
- prompt: "打开商城页面，找到商品列表中的第一个商品，点击'加入购物车'按钮，然后检查购物车图标的数量是否增加，验证功能是否正常"

示例 5：数据采集

用户需求: "从这个页面提取所有产品标题"

执行方式:

code

调用 Task tool:
- subagent_type: "chrome-devtools-expert"
- description: "提取产品标题"
- prompt: "从当前页面使用 JavaScript 提取所有产品标题，返回一个标题列表"

示例 6：网络条件测试

用户需求: "在慢速 3G 网络下测试页面加载"

执行方式:

code

调用 Task tool:
- subagent_type: "chrome-devtools-expert"
- description: "慢速网络测试"
- prompt: "设置网络模拟为 Slow 3G，打开 https://example.com，记录页面加载时间和用户体验，然后恢复正常网络"

示例 7：多步骤操作

用户需求: "打开网站，登录，然后导航到设置页面并截图"

执行方式:

code

调用 Task tool:
- subagent_type: "chrome-devtools-expert"
- description: "登录并截图设置页"
- prompt: "1) 打开 https://example.com
2) 填写登录表单（用户名：test@example.com，密码：password123）并提交
3) 等待登录成功
4) 点击导航栏的'设置'链接
5) 等待设置页面加载完成
6) 截取设置页面的完整截图并保存"

执行原则

•自动识别: 当判断需要浏览器操作时，自动激活本技能
•快速委派: 不在主对话中尝试浏览器操作，直接委派给专业 agent
•上下文隔离: 将大量的浏览器输出数据隔离在 agent 上下文中
•结果精简: agent 只返回关键操作结果，过滤冗余信息
•效率优先: agent 会采用最优策略执行浏览器操作，最小化 token 消耗

通过本技能，主 agent 可以高效地将浏览器自动化任务委派给专业 agent，保持对话流程清晰，优化 token 使用。