g-plan / 文档 09 — 构建架构简报
选定的构建架构

客户端本地代理 — 在店主自有设备上运行

在店主自己的电脑上运行代理 — 使用真实的网络连接和真实的 Chrome。真正的住宅 IP + 真实浏览器消除了数据中心 IP 的硬性封锁。店主在场时可以完成登录和图像验证(画像認証)。个人信息留在日本。

本地执行是根基 — 它消除了数据中心 IP 硬性封锁,是现有最优的反机器人姿态。构建重心集中在:像人类一样操作浏览器,不留自动化痕迹把跨平台 OS 输入驱动做好,以及绝不过度信任代理的写操作
青色 = 可构建 / 我方 / 选定机制 绿色 = 已验证的优势 琥珀色 = 警示 / 调优目标 / 有条件 红色 = 受阻 / 禁止 / 绝不可行
基础优势与构建重心

本地执行带来了什么 — 以及我们需要攻克什么才能通过检测。

基础优势 — 已验证的胜利

置信度:高

数据中心 IP 硬性封锁已消除

真正的第一方住宅/商业 ISP IP 获得正向基线信任评分 — 甚至优于租用的住宅代理(Akamai 会交叉比对 GeoGuard 的劫持住宅代理数据库)。消除了所有云端原型必然遭遇的封锁。

置信度:高

TLS/JA3/JA4 + HTTP-2 指纹天然真实

真实 Chrome BoringSSL ClientHello + 操作系统 net/ 协议栈 = 原生指纹,无需伪造。这是 Chrome 构建版本的属性,与驱动方式无关。

置信度:高

店主在场完成登录/验证码

真实人类使用真实设备 → 真实的 _abck / sensor_data。店主在需要时亲自解答图像验证(画像認証)。无需合成遥测数据。

置信度:高

个人信息留在日本

确定性提取在本地运行;代理回退使用自托管的日本 GPU 模型。客户数据不会越境。将 08 文档中最大的隐患扭转为优势。

构建重心 — 第一阶段的调优内容

必要但不充分

IP 只是 Akamai 5+ 层检测中的一层

行为生物特征、意图/会话图谱分析、设备指纹、验证码挑战等层仍然存在。真实 IP 消除了硬性封锁 — 其余部分是调优目标。

核心调优目标

行为 + 意图-会话图谱的拟真度

DataDome/Akamai 会评分鼠标轨迹曲率、滚动/打字节奏以及导航意图图谱。这一残留风险本身足以令方案失败;第一阶段测量实际标记率并持续调优至低水平 — 这是质量保证循环,不是事后补丁。

需要协调

多重登录(单一活动会话)

代理现在使用的是店主自己的会话,因此自动化运行可能会将员工踢下线。非营业时段调度、专用子账号以及与店主的明确协调比以往更加重要。

新增工程量

分发、信任与支持

在店主设备上运行的软件带来新课题:面向非技术用户的安装/签名、凭据保管、自动更新、杀毒软件误报,以及更大的信任/责任范围。

服务条款(ToS)/法律问题暂缓处理 — 在 06-legal-tos-and-risk.md 中单独跟踪,公开发布前再行评估。
§3 — 如何驱动浏览器

成败关键的构建规格。

多因子可检测性排名 — 不仅仅看 isTrusted。排名综合考量自动化启动标志、CDP 副作用、输入事件的几何/时序特征、扩展痕迹以及会话内行为。

方法自动化标志CDP 副作用输入真实性综合评级
OS 级输入注入 + 无 Runtime.enable 的 DOM 读取可信,真实几何/时序最低 — 目标
OS 输入 + 最小 CDP 读取极少可信
Native messaging + 内容脚本脚本化 DOM 事件中等
CDP 附加 + Patchright / rebrowser-patchesRuntime.enable 已缓解CDP 注入中等
CDP 附加,用户 Chrome,无自动化标志Runtime.enable(若调用)CDP 注入
chrome.debugger 扩展Runtime.enable(若调用)近似可信,约 2ms 延迟高(+ 可见信息栏)
原生 Playwright/Puppeteer over CDP--enable-automationRuntime.enableCDP 注入极高
硬性不变量

navigator.webdriver 自检

在任何实际导航前必须等于 false。框架可能悄悄重新添加 --enable-automation。自检内容:navigator.webdriver === false,无 --enable-automation,无自动化扩展。

硬性不变量

Chrome 136+ → 必须使用专用非默认 --user-data-dir

Chrome 136+ 会在默认配置文件上忽略 --remote-debugging-port(反信息窃取策略)。必须使用独立的、已完成一次登录的配置文件或 Chrome for Testing。不可协商。

禁止

绝不可使用 Playwright APIRequestContext

用于承载 Salon Board 流量时。它是基于 Node 的 HTTP 客户端(Node http/https + OpenSSL,无 HTTP/2)— TLS/H2 指纹会偏离真实 Chrome。只能使用页面内的真实 fetch/XHR。

§3a — OS 输入驱动是核心工程难点

通过 OS 级输入进行驱动是一个真正的跨平台组件 — 它是整个构建的核心。需要覆盖的范围:

窗口焦点/前台化 屏幕锁定/RDP 显示缩放/多显示器 日文 IME 安全输入 macOS 辅助功能 + 屏幕录制权限 Windows UAC / 安全桌面 杀毒软件/EDR 误报 Chrome UI 变更

先攻克一个操作系统,配合回放遥测数据和故障分类体系,之后再移植。这是第零阶段的主要工作量。

替代驱动方案 — DOUKI 路线

Chrome 扩展 + native-messaging 在真实浏览器/会话内运行,绕过 Chrome 136 远程调试限制。代价:扩展指纹化 + 两部分安装流程。两种驱动方案都可接入同一套技能库/代理设计。

第零阶段同时原型验证两种驱动方案,基于实际证据择优 — OS 输入 vs 扩展 + native-messaging。

§4 — 三种个人信息模式

需要精确区分:"本地" ≠ "无传输"。

将截图发送至我们自托管的日本 GPU 仍然是从店主设备外泄的个人信息 — 虽在境内,但属于受托处理(委託)。必须对每条路径显式建模。

模式离开设备的数据APPI 合规姿态
A — 零外泄纯本地 无(确定性提取保留在设备上) 最强:无传输,无受托处理
B — 境内受托处理(日本 GPU) 截图 → 我们在日本的 GPU 模型 受托处理(委託)适用 — 需监管处理方、安全措施、合同;无跨境传输
C — 跨境模型路径 截图 → 美国/海外推理 第 28 条跨境传输 — 对客户个人信息禁止

默认使用模式 A,将模式 B 视为受托处理(委託)并执行完整的委托合同 + 监管义务,禁止模式 C 用于客户个人信息。除非法务确认无运营方、模型、日志或遥测路径会接触个人信息,否则受托处理义务不会消失。

§5 — 架构

本地数据面 + 中央控制面。

店主设备(日本)— 数据面
真实住宅/商业 IP · 干净
专用已登录 Chrome 配置文件
非默认 user-data-dir · webdriver=false
OS 输入注入 扩展驱动
DOM 读取无需 Runtime.enable
① 确定性快速路径
本地运行,约 $0,个人信息留在本地
② 缓存的 DOM 锚定技能回放
③ 代理回退 → 自托管日本 GUI 模型
仅 READ/侦察,受监管
✋ 写操作 = 仅提案 — 人工审批
🛑 Akamai/验证码/会话丢失 = 停止 + 告警(绝不自修复)
控制面(我方基础设施,日本)
版本化技能库
语义化版本、不可变、活跃通道指针 stable|canary
主代理
通过夹具回放 + 金丝雀验证 · 写操作/模式变更需人工审批
热部署技能包 ↔ 工作节点
拉取模式,非推送 · O(1) 回滚
偏移报告上传
诊断 → 提案 → 验证 → 晋升
GUI 模型:UI-TARS-1.5-7B / Qwen2.5-VL-7B
Apache-2.0 · vLLM · 单张 24GB GPU · browser-use
受监管回退 — 绝不自主写入
当前候选(2026年6月)— 需重新验证
§6 — 离线 = 正确性

数据过时是正确性缺陷,不只是运维问题。

店主设备在轮询窗口期间休眠 → 主日历过时 → 时段锁定扇出错过竞争窗口 → 跨平台重复预订。

不变量

心跳驱动的调度

当最后一次 Salon Board 读取超过租户级最大过时阈值时,禁止任何写入或扇出操作。可见的降级模式通知店主其数据已过时。

建议

常驻托管迷你 PC

对于高频多平台租户,默认采用常驻运行的托管迷你 PC 而非店主的日常笔记本电脑。消费级设备会休眠、关机,并可能触发杀毒软件误报。

不变量

租户级最大过时阈值

每个租户可配置阈值。阈值内,调度和扇出正常运行。超出阈值,系统进入降级模式并拒绝写入,直到最新读取确认状态。

§7 — 熔断开关与灰度发布管控

任何集群暴露前必须就绪。

租户级远程禁用 全局功能开关 技能包版本锁定 + O(1) 回滚 最大登录/验证码尝试预算 账号锁定冷却期 验证码/会话/标记率飙升时自动回滚 金丝雀扩展门控 可观测性:每租户的回退率/标记率/过时度

金丝雀扩展:少量租户 → 测量验证码/会话冲突/标记率 → 指标达标后才扩大范围。每次技能晋升都有审计日志,含诊断记录 + 审批人。

§8 — 先例

成熟模式 — 可行性已确立。

已确认在线运营

DOUKI — 正是这一模型

一个运行在美容院自有浏览器中的 Chrome 扩展(+ native host),无 Salon Board API。这恰恰是本文提出的客户端架构,已在该市场正式运营。

十年成熟品类

有人值守的 RPA

UiPath、Power Automate Desktop、Automation Anywhere — 在用户的设备上运行,使用用户的会话和凭据。已验证的部署模式。

浏览器代理工具

browser-use / CDP 附加

browser-use、Bardeen、Axiom.ai 附加到用户已登录的浏览器上,明确目的就是利用真实指纹并避免机器人检测。Chrome 146 的"允许远程调试"选项是平台自身的背书。

正面解读:先例降低了实施风险,也是我们将可行性视为既定事实的依据。拟人化调优(§3)和人工审批写入是我们仍需构建的工程——用以确保其稳健可靠。

§9 — 分阶段构建时间线

确定的构建方案 — 不是可行性试探。

第零阶段 — 构建驱动底层

不访问 Salon Board。$0 成本。

  • 先为一个操作系统构建 OS 输入驱动:IME 安全输入、焦点管理、缩放适配、webdriver 自检、无 Runtime.enable 的 DOM 读取、回放遥测
  • 扩展 + native-messaging 驱动同步原型验证(DOUKI 路线)
  • 本地 ↔ 控制面协议(拉取技能包、上报偏移;绝不发送个人信息
  • 自托管 GUI 模型(UI-TARS-1.5-7B / Qwen2.5-VL-7B)部署在日本 GPU 上,对接 browser-use
第一阶段 — 首个知情同意店主

测量并调优实际标记率。

  • 签名助手程序(包装方案基于第零阶段验证结论选定)
  • 确定性本地快速路径(模式 A)+ 缓存技能
  • 仅 READ/侦察的受监管回退(模式 B + 受托处理合同)
  • 店主在场完成登录/验证码,含 SLA 约定超时
  • 测量并调优实际验证码/标记率(QA 循环)
  • 发现实际的会话/MFA/锁定行为
第二阶段 — 多租户

技能库 → 热部署 → 集群。

  • 技能库偏移 → 热部署修复至全集群
  • 所有写操作均需人工审批
  • Rakuten Beauty 通过 http_api(文档 07)
  • 安装/更新/支持工具链 + 健康仪表板
  • 降级模式 + 最大过时阈值强制执行
始终遵守 — 不变量:使用 OS 输入或扩展驱动(绝不使用原生 Playwright-over-CDP)· 绝不使用 APIRequestContext · 仅限专用配置文件 · 代理绝不自动确认预订 · 反机器人升级停止并告警,绝不自修复 · 数据过时时禁止写入/扇出 · 每次技能晋升均有审计日志。