跳到主要内容

2 篇博文 含有标签「CDP」

查看所有标签

🦾 [浏览器自动化] 可为与不可为:CDP 视角下的 Browser 控制边界

· 阅读需 17 分钟
卤代烃
微信公众号@卤代烃实验室

cdp-browser-use-hero.jpg

如果我们把人类对电脑的所有操作记为全集,那么 Browser, CDP 和 puppeteer 可操作的集合范畴如下:

  • Computer:所有操作的全集
  • Browser:App 层权限,Browser 为了安全,还限制了许多能力,比如说直接操作本地的文件
  • CDP:专注于 Debug 能力,浏览器的非调试信息(比如说收藏网页)是没有权限访问的
  • puppeteer:基于 CDP 构建,但是有一部分 CDP API 并没有用到,所以能力属于 CDP 的子集

在 Browser-Use 场景,不同于 VNC 这种更为通用的投屏方案,CDP 是有能力边界的,所以说知道它擅长什么不擅长什么,对于架构的整体设计和未来演化方向有很大的意义。