Midscene.js 简介

核心功能

  1. 通过自然语言交互、查询和断言

    • 动作(action):使用 .ai.aiAction 方法,通过描述步骤执行一系列操作。
    • 查询(query):使用 .aiQuery 方法,从 UI 中提取自定义数据。描述所需的 JSON 格式,AI 将根据其对页面的“理解”提供答案。
    • 断言(assert):使用 .aiAssert 方法,在页面上执行断言。
    • 优势:所有这些方法都接受自然语言提示作为参数,显著降低了脚本维护成本。
  2. 从 Chrome 扩展开始

    • Midscene 提供 Chrome 扩展,允许用户在任何网页上使用 Midscene,无需编写代码。
    • 安装链接:Chrome Web Store
    • 使用说明:Quick Experience
  3. 多种集成方式

    • YAML 脚本自动化:如果更倾向于编写 YAML 文件而不是代码,可以选择此方式。
    • 通过 Chrome 扩展的桥接模式:通过脚本控制桌面 Chrome。
    • 与 Puppeteer 集成集成文档
    • 与 Playwright 集成集成文档
    • 示例代码:
      // 执行搜索操作
      await ai('type "Headphones" in search box, hit Enter');
      // 查询商品信息并以 JSON 格式返回
      const items = await aiQuery("{itemTitle: string, price: Number}[], find item in list and corresponding price");
      console.log("headphones in stock", items);
      // 断言页面上的元素
      await aiAssert("There is a category filter on the left");
      
  4. 可视化报告

    • Midscene 提供可视化报告,帮助用户在每次运行后更稳定地进行自动化操作并更轻松地调试。
    • 报告中包含动画回放和每一步的详细信息。
    • 报告文件中还提供了一个“游乐场”,用户可以在其中调整提示,而无需重新运行所有脚本。
  5. 支持通用 LLM 和开源模型

    • Midscene 支持通用 LLM(如 gpt-4o)和开源模型。
    • 通用 LLM:适用于大多数场景。
    • 开源模型(UI-TARS):基于 VLM 架构的端到端 GUI 代理模型,可在自己的服务器上部署,显著提升性能和数据隐私。
    • 更多信息:选择模型
  6. 与其他工具的比较

    • 调试体验:Midscene 提供可视化报告文件、内置游乐场和 Chrome 扩展,简化调试过程。
    • 开源、免费、自由部署:Midscene 是开源项目,与任何云服务或模型提供商解耦,用户可以选择公共或私有部署。
    • 与 JavaScript 集成:Midscene 与 JavaScript 完美集成。
  7. 数据隐私

    • 所有从页面收集的数据将直接发送到 OpenAI 或自定义模型提供商,不会被第三方平台访问。
    • 更多信息:数据隐私

其他资源

总结

Midscene.js 是一个基于 AI 的自动化工具,通过自然语言交互、查询和断言,提供多种集成方式和强大的调试工具。它支持通用 LLM 和开源模型,注重数据隐私,并且完全开源,用户可以自由选择部署方式。

### 安装 Midscene.js 的逐步指南 #### 准备工作 为了确保顺利安装 Midscene.js,需确认环境已准备好必要的依赖项。通常情况下,Midscene.js 可能依赖于 Node.js 和 npm (Node Package Manager),这些工具允许开发者轻松管理 JavaScript 库及其版本。 #### 安装 Node.js 和 npm 对于大多数现代 Linux 发行版而言,可以通过包管理器来安装 Node.js 和 npm: 针对基于 Debian 或 Ubuntu 的系统: ```bash sudo apt update && sudo apt install nodejs npm -y ``` 对于基于 Red Hat 或 CentOS 的系统,则可以使用如下命令[^3]: ```bash sudo yum install epel-release sudo yum install nodejs npm ``` #### 获取并安装 Midscene.js 一旦有了合适的开发环境,就可以通过 GitHub 下载最新的 Midscene.js 版本或是利用 npm 进行全局安装。如果项目托管在 GitHub 上,可以从仓库克隆最新源码;而更简便的方式则是直接经由 npm 命令完成安装过程。 假设 Midscene.js 已发布至 npm 注册表中,那么只需执行以下命令即可实现快速部署: ```bash npm install midscene --save ``` 这会自动下载所需的文件并将它们添加到项目的 `node_modules` 文件夹下。同时,在生产环境中建议加上 `--production` 参数以排除不必要的测试和构建工具。 #### 验证安装成功与否 最后一步是要验证是否正确设置了 Midscene.js。可以在应用程序目录内创建一个新的 JavaScript 文件(例如 test-midscene.js),并向其中加入简单的调用语句来进行初步检验: ```javascript const midscene = require('midscene'); console.log(midscene.version); // 输出当前使用的 Midscene.js 版本号 ``` 运行此脚本应返回所期望的结果,表明一切正常运作。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值