浏览器自动化也能这么简单?Claude Code + BrowserCat MCP 全流程实战拆解

写网页自动化还在手写 Puppeteer?现在可以直接用 Claude 跟 MCP 对话了!

在网页自动化这条赛道上,传统的工具链已经越来越难满足高频迭代与非技术团队的场景需求。本文将带你从零开始,实操一整套基于 Claude Code + BrowserCat MCP 的自动化方案,手把手构建出完整的“访问网页 → 自动点击 → 提取信息 → 截图留存”的全链路流程。

不仅适合开发者高效测试页面,也适合运营、产品进行数据获取与交互模拟。


🧱 环境准备:用 Claude Code 写代码前,你需要配置这些

本地运行 Claude Code 的关键在于配置 Linux 环境,这里我们借助 WSL(Windows 子系统 for Linux) 来完成:

✅ 安装步骤概览:

  1. 在 Microsoft Store 安装 Ubuntu 20.04.6 LTS

  2. 以管理员身份打开 PowerShell,执行:

    wsl --install
    

    或手动启用 Linux 子系统:

    dism.exe /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux /all /norestart
    dism.exe /online /enable-feature /featurename:VirtualMachinePlatform /all /norestart
    
  3. 安装完成后输入 wsl -l -v 验证是否成功

完成之后,启动 Ubuntu,并设置用户名、密码。


🔧 配置 Claude Code 插件与远程终端

在 VSCode 中安装插件 Claude Code for VSCode,点击左下角远程终端链接图标,连接到你刚安装的 WSL 子系统。

执行以下命令安装 Claude Code:

curl -fsSL https://www.aicodemirror.com/resource/install/install.sh | bash

注册/激活详见官网:Claude Code 安装引导


🧩 接入 BrowserCat MCP:自动化的“大脑”

我们前往 蓝耘 MCP 广场 注册并搜索 BrowserCat,这是一个封装了浏览器操作能力的自动化服务组件。

注册后,选择免费套餐并绑定信用卡(必须),然后创建自己的 API Key。

使用如下 JSON 配置 MCP:

{
  "mcpServers": {
    "browsercat": {
      "command": "npx",
      "args": ["-y", "@browsercatco/mcp-server"],
      "env": {
        "BROWSERCAT_API_KEY": "你的API密钥"
      }
    }
  }
}

复制上述内容保存为 mcp.json,在 Claude Code 中通过命令或对话方式载入 MCP:

claude mcp add-json browsercat <mcp配置JSON>

🕹 常用指令:BrowserCat MCP 能做什么?

BrowserCat 封装了 10+ 浏览器交互 API,可直接通过 Claude 触发,包括:

  • browsercat_navigate:访问网页 URL

  • browsercat_click:模拟点击按钮/元素

  • browsercat_fill:自动填入表单数据

  • browsercat_select:选择下拉选项

  • browsercat_hover:模拟鼠标悬停

  • browsercat_screenshot:网页截图保存

  • browsercat_evaluate:执行 JS 代码片段

一句话总结:你能手动点的,它都能自动化点出来,还能截图和提取数据。


🎯 实战演示:Claude 自动帮我搜索“如何减肥”

我们先让 Claude 使用 browsercat_navigate 进入百度首页,然后通过 browsercat_fill 填入搜索关键词,再通过 browsercat_click 模拟点击搜索按钮,结果:

  • 成功访问

  • 成功截图

  • 成功抓取网页内容反馈


📌 总结:AI 编排自动化,不再需要自己写脚本了

这次基于 Claude Code + BrowserCat MCP 的实践,展示了一个全新的浏览器自动化范式:

✅ Claude 负责理解任务
✅ BrowserCat 负责精确执行
✅ MCP 广场提供能力生态支持

无论是做自动测试、网页爬虫、表单录入、运营监控,甚至是跨端交互模拟,只需配置好一套 Claude + MCP,即可像对话一样控制浏览器行为。

🎉 欢迎感兴趣的小伙伴上手试试 →
👉 MCP 注册地址(附推荐码)

### MCP 协议简介 Claude Code 的强大之处在于其通过 **MCP(Model Context Protocol,模型上下文协议)** 与外部工具的无缝连接能力。MCP 协议是一种结构化通信机制,允许大型语言模型(LLM)直接控制和交互各种外部服务,如浏览器自动化、代码执行环境、数据库查询等,从而显著扩展 AI 模型的功能边界[^2]。 在实际应用中,MCP 可以让 Claude Code 执行多种复杂任务,例如网页数据抓取、自动填写表单、调用 API 接口以及管理本地开发环境等。这种能力使得用户能够将 AI 编程助手从一个单纯的代码生成器升级为一个可以主动执行任务的智能代理。 --- ### 常见的 MCP 命令 MCP 的操作需要在终端命令行界面中进行,不能通过软件内部设置完成。以下是一些基本的 MCP 命令: - `claude mcp list`:列出当前所有已安装的 MCP 服务。 - `claude mcp add`:添加新的 MCP 服务到当前环境中。 - `claude mcp remove`:移除某个不再需要的 MCP 服务。 这些命令可以帮助开发者灵活地管理他们所使用的外部工具和服务,确保工作流程的高效性和可控性[^1]。 --- ### 使用场景与实战示例 #### 浏览器自动化 **Browser MCP** 是基于 MCP 协议的一个典型应用场景,它使 LLM 能够直接控制浏览器行为,包括导航、点击按钮、填写表单、截图等功能。这种能力特别适用于自动化测试、数据爬虫或模拟用户操作等任务。相比于传统的视觉识别方式,Browser MCP 不依赖图像处理技术,而是通过结构化的指令集来实现更稳定和高效的浏览器控制[^4]。 例如,使用 Browser MCP 进行网页搜索并保存结果页面的截图,可以通过如下伪代码表示: ```python # 示例代码:使用 Browser MCP 进行网页搜索和截图 mcp.browser.navigate("https://www.google.com") mcp.browser.fill_form({"q": "Claude Code MCP 使用指南"}) mcp.browser.submit_form() mcp.browser.take_screenshot("search_results.png") ``` 此代码片段展示了如何利用 MCP 控制浏览器执行一系列动作,而无需手动干预或编写复杂的 Selenium 脚本。 --- ### 上下文管理功能 除了对 MCP 服务本身的控制外,Claude Code 还提供了一系列用于管理上下文状态的命令,以帮助用户更好地维护对话历史和临时数据: - `/memory`:编辑或查看当前的记忆内容,类似于为 AI 设置个性化的“内功心法”。 - `/mcp`:检查当前 MCP 服务的状态,确保所有外部工具正常运行。 - `/compact`:压缩上下文信息,避免因上下文过长而导致性能下降。 - `/clean`:清空当前上下文,重置工作环境。 - `/resume`:查看之前的交互记录,回顾与 AI 的协作过程。 这些命令对于保持良好的用户体验至关重要,尤其是在长时间连续使用时,合理管理上下文有助于提升响应速度和准确性[^3]。 --- ### 总结 综上所述,Claude CodeMCP 功能不仅提升了 AI 在编程领域的实用性,还打开了通往更多高级应用的大门。无论是前端开发中的浏览器自动化,还是后端服务的集成调用,MCP 都能为用户提供强大的支持。掌握 MCP 的基本命令及其应用场景,是充分发挥 Claude Code 潜力的关键一步。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值