Jit-Browser Jit-4 平台的一部分 EN-CA |

HeadlessChrome101:Jit-Browser 如何将 Chrome 转变为全功能浏览器–服务器-浏览器层

这是对 Jit-Browser 如何使用无头 Chrome、如何使用专有的 Jit-TR 运行时以及为了使其成为一流的浏览器功能而不是仅仅是另一个脚本所需的内容的通俗语言演练。

从一个简单的截图工具到 Jit-Browser

我们从一个小的命令行工具开始: getpage https://example.com page.png. 它在 Docker 容器中启动 Chrome,截取渲染的 example.com 页面截图,然后退出。

有用的概念验证。每次调用都是冷启动。它对翻译、会话或状态一无所知。它只是一个无头相机。

Jit-Browser 是下一步。它仍然使用真实的 Chrome,但现在:

  • 它记录页面内部发生的事情。
  • 它将 Jit-TR 脚本注入为翻译层。
  • 它可以遵循简单的流程,如 cookie 横幅或下拉菜单。
  • 它捕获完全翻译的 HTML,而不仅仅是截图。

本页面解释了该管道,以便您可以看到我们并没有敷衍。我们展示了浏览器级多语言层如何实际工作。

Jit-Browser 管道的 6 个步骤

在高层次上,每次捕获都遵循相同的顺序。

  1. 在 Docker 内启动真实的 Chrome(无头)。
    我们使用 Puppeteer (pptr.dev) 启动与普通浏览器相同的引擎,但没有可见窗口。没有自定义解析器,没有假渲染。
  2. 应用 cookie 或登录状态(如果已配置)。
    对于需要登录会话的演示,我们重放您的 cookie。没有暴力破解,没有密码猜测,没有抓取我们无法控制的账户。
  3. 像用户一样精确加载目标页面。
    HTML、CSS、JavaScript、字体、图像。我们等待 networkidle2 (https://pptr.dev/api/puppeteer.page.waitfornetworkidle) 以便慢速包和字体可以完成加载。
  4. 注入 Jit-TR 片段作为层。
    我们添加一个指向我们专利申请中运行时代码的脚本标签 – 例如: