g-plan / 文档 09 — 构建架构简报

选定的构建架构

客户端本地代理 — 在店主自有设备上运行

在店主自己的电脑上运行代理 — 使用真实的网络连接和真实的 Chrome。真正的住宅 IP + 真实浏览器消除了数据中心 IP 的硬性封锁。店主在场时可以完成登录和图像验证（画像認証）。个人信息留在日本。

本地执行是根基 — 它消除了数据中心 IP 硬性封锁，是现有最优的反机器人姿态。构建重心集中在：像人类一样操作浏览器，不留自动化痕迹，把跨平台 OS 输入驱动做好，以及绝不过度信任代理的写操作。

青色 = 可构建 / 我方 / 选定机制绿色 = 已验证的优势琥珀色 = 警示 / 调优目标 / 有条件红色 = 受阻 / 禁止 / 绝不可行

基础优势与构建重心

本地执行带来了什么 — 以及我们需要攻克什么才能通过检测。

▸ 基础优势 — 已验证的胜利

置信度：高

数据中心 IP 硬性封锁已消除

真正的第一方住宅/商业 ISP IP 获得正向基线信任评分 — 甚至优于租用的住宅代理（Akamai 会交叉比对 GeoGuard 的劫持住宅代理数据库）。消除了所有云端原型必然遭遇的封锁。

置信度：高

TLS/JA3/JA4 + HTTP-2 指纹天然真实

真实 Chrome BoringSSL ClientHello + 操作系统 net/ 协议栈 = 原生指纹，无需伪造。这是 Chrome 构建版本的属性，与驱动方式无关。

置信度：高

店主在场完成登录/验证码

真实人类使用真实设备 → 真实的 _abck / sensor_data。店主在需要时亲自解答图像验证（画像認証）。无需合成遥测数据。

置信度：高

个人信息留在日本

确定性提取在本地运行；代理回退使用自托管的日本 GPU 模型。客户数据不会越境。将 08 文档中最大的隐患扭转为优势。

▸ 构建重心 — 第一阶段的调优内容

必要但不充分

IP 只是 Akamai 5+ 层检测中的一层

行为生物特征、意图/会话图谱分析、设备指纹、验证码挑战等层仍然存在。真实 IP 消除了硬性封锁 — 其余部分是调优目标。

核心调优目标

行为 + 意图-会话图谱的拟真度

DataDome/Akamai 会评分鼠标轨迹曲率、滚动/打字节奏以及导航意图图谱。这一残留风险本身足以令方案失败；第一阶段测量实际标记率并持续调优至低水平 — 这是质量保证循环，不是事后补丁。

需要协调

多重登录（单一活动会话）

代理现在使用的是店主自己的会话，因此自动化运行可能会将员工踢下线。非营业时段调度、专用子账号以及与店主的明确协调比以往更加重要。

新增工程量

分发、信任与支持

在店主设备上运行的软件带来新课题：面向非技术用户的安装/签名、凭据保管、自动更新、杀毒软件误报，以及更大的信任/责任范围。

服务条款（ToS）/法律问题暂缓处理 — 在 06-legal-tos-and-risk.md 中单独跟踪，公开发布前再行评估。

§3 — 如何驱动浏览器

成败关键的构建规格。

多因子可检测性排名 — 不仅仅看 isTrusted。排名综合考量自动化启动标志、CDP 副作用、输入事件的几何/时序特征、扩展痕迹以及会话内行为。

方法	自动化标志	CDP 副作用	输入真实性	综合评级
OS 级输入注入 + 无 Runtime.enable 的 DOM 读取	无	无	可信，真实几何/时序	最低 — 目标
OS 输入 + 最小 CDP 读取	无	极少	可信	低
Native messaging + 内容脚本	无	无	脚本化 DOM 事件	中等
CDP 附加 + Patchright / rebrowser-patches	无	Runtime.enable 已缓解	CDP 注入	中等
CDP 附加，用户 Chrome，无自动化标志	无	Runtime.enable（若调用）	CDP 注入	高
`chrome.debugger` 扩展	无	Runtime.enable（若调用）	近似可信，约 2ms 延迟	高（+ 可见信息栏）
原生 Playwright/Puppeteer over CDP	`--enable-automation`	Runtime.enable	CDP 注入	极高

硬性不变量

`navigator.webdriver` 自检

在任何实际导航前必须等于 false。框架可能悄悄重新添加 --enable-automation。自检内容：navigator.webdriver === false，无 --enable-automation，无自动化扩展。

硬性不变量

Chrome 136+ → 必须使用专用非默认 `--user-data-dir`

Chrome 136+ 会在默认配置文件上忽略 --remote-debugging-port（反信息窃取策略）。必须使用独立的、已完成一次登录的配置文件或 Chrome for Testing。不可协商。

禁止

绝不可使用 Playwright `APIRequestContext`

用于承载 Salon Board 流量时。它是基于 Node 的 HTTP 客户端（Node http/https + OpenSSL，无 HTTP/2）— TLS/H2 指纹会偏离真实 Chrome。只能使用页面内的真实 fetch/XHR。

§3a — OS 输入驱动是核心工程难点

通过 OS 级输入进行驱动是一个真正的跨平台组件 — 它是整个构建的核心。需要覆盖的范围：

窗口焦点/前台化屏幕锁定/RDP 显示缩放/多显示器日文 IME 安全输入 macOS 辅助功能 + 屏幕录制权限 Windows UAC / 安全桌面杀毒软件/EDR 误报 Chrome UI 变更

先攻克一个操作系统，配合回放遥测数据和故障分类体系，之后再移植。这是第零阶段的主要工作量。

替代驱动方案 — DOUKI 路线

Chrome 扩展 + native-messaging 在真实浏览器/会话内运行，绕过 Chrome 136 远程调试限制。代价：扩展指纹化 + 两部分安装流程。两种驱动方案都可接入同一套技能库/代理设计。

第零阶段同时原型验证两种驱动方案，基于实际证据择优 — OS 输入 vs 扩展 + native-messaging。

§4 — 三种个人信息模式

需要精确区分："本地" ≠ "无传输"。

将截图发送至我们自托管的日本 GPU 仍然是从店主设备外泄的个人信息 — 虽在境内，但属于受托处理（委託）。必须对每条路径显式建模。

模式	离开设备的数据	APPI 合规姿态
A — 零外泄纯本地	无（确定性提取保留在设备上）	最强：无传输，无受托处理
B — 境内受托处理（日本 GPU）	截图 → 我们在日本的 GPU 模型	受托处理（委託）适用 — 需监管处理方、安全措施、合同；无跨境传输
C — 跨境模型路径	截图 → 美国/海外推理	第 28 条跨境传输 — 对客户个人信息禁止

默认使用模式 A，将模式 B 视为受托处理（委託）并执行完整的委托合同 + 监管义务，禁止模式 C 用于客户个人信息。除非法务确认无运营方、模型、日志或遥测路径会接触个人信息，否则受托处理义务不会消失。

§5 — 架构

本地数据面 + 中央控制面。

店主设备（日本）— 数据面
真实住宅/商业 IP · 干净

专用已登录 Chrome 配置文件
非默认 user-data-dir · webdriver=false

OS 输入注入或扩展驱动
DOM 读取无需 Runtime.enable

① 确定性快速路径
本地运行，约 $0，个人信息留在本地

② 缓存的 DOM 锚定技能回放

③ 代理回退 → 自托管日本 GUI 模型
仅 READ/侦察，受监管

✋ 写操作 = 仅提案 — 人工审批
🛑 Akamai/验证码/会话丢失 = 停止 + 告警（绝不自修复）

控制面（我方基础设施，日本）

版本化技能库
语义化版本、不可变、活跃通道指针 stable|canary

主代理
通过夹具回放 + 金丝雀验证 · 写操作/模式变更需人工审批

热部署技能包 ↔ 工作节点
拉取模式，非推送 · O(1) 回滚

偏移报告上传
诊断 → 提案 → 验证 → 晋升

GUI 模型：UI-TARS-1.5-7B / Qwen2.5-VL-7B
Apache-2.0 · vLLM · 单张 24GB GPU · browser-use
受监管回退 — 绝不自主写入
当前候选（2026年6月）— 需重新验证

§6 — 离线 = 正确性

数据过时是正确性缺陷，不只是运维问题。

店主设备在轮询窗口期间休眠 → 主日历过时 → 时段锁定扇出错过竞争窗口 → 跨平台重复预订。

不变量

心跳驱动的调度

当最后一次 Salon Board 读取超过租户级最大过时阈值时，禁止任何写入或扇出操作。可见的降级模式通知店主其数据已过时。

建议

常驻托管迷你 PC

对于高频多平台租户，默认采用常驻运行的托管迷你 PC 而非店主的日常笔记本电脑。消费级设备会休眠、关机，并可能触发杀毒软件误报。

不变量

租户级最大过时阈值

每个租户可配置阈值。阈值内，调度和扇出正常运行。超出阈值，系统进入降级模式并拒绝写入，直到最新读取确认状态。

§7 — 熔断开关与灰度发布管控

任何集群暴露前必须就绪。

租户级远程禁用全局功能开关技能包版本锁定 + O(1) 回滚最大登录/验证码尝试预算账号锁定冷却期验证码/会话/标记率飙升时自动回滚金丝雀扩展门控可观测性：每租户的回退率/标记率/过时度

金丝雀扩展：少量租户 → 测量验证码/会话冲突/标记率 → 指标达标后才扩大范围。每次技能晋升都有审计日志，含诊断记录 + 审批人。

§8 — 先例

成熟模式 — 可行性已确立。

已确认在线运营

DOUKI — 正是这一模型

一个运行在美容院自有浏览器中的 Chrome 扩展（+ native host），无 Salon Board API。这恰恰是本文提出的客户端架构，已在该市场正式运营。

十年成熟品类

有人值守的 RPA

UiPath、Power Automate Desktop、Automation Anywhere — 在用户的设备上运行，使用用户的会话和凭据。已验证的部署模式。

浏览器代理工具

browser-use / CDP 附加

browser-use、Bardeen、Axiom.ai 附加到用户已登录的浏览器上，明确目的就是利用真实指纹并避免机器人检测。Chrome 146 的"允许远程调试"选项是平台自身的背书。

正面解读：先例降低了实施风险，也是我们将可行性视为既定事实的依据。拟人化调优（§3）和人工审批写入是我们仍需构建的工程——用以确保其稳健可靠。

§9 — 分阶段构建时间线

确定的构建方案 — 不是可行性试探。

第零阶段 — 构建驱动底层

不访问 Salon Board。$0 成本。

先为一个操作系统构建 OS 输入驱动：IME 安全输入、焦点管理、缩放适配、webdriver 自检、无 Runtime.enable 的 DOM 读取、回放遥测
扩展 + native-messaging 驱动同步原型验证（DOUKI 路线）
本地 ↔ 控制面协议（拉取技能包、上报偏移；绝不发送个人信息）
自托管 GUI 模型（UI-TARS-1.5-7B / Qwen2.5-VL-7B）部署在日本 GPU 上，对接 browser-use

第一阶段 — 首个知情同意店主

测量并调优实际标记率。

签名助手程序（包装方案基于第零阶段验证结论选定）
确定性本地快速路径（模式 A）+ 缓存技能
仅 READ/侦察的受监管回退（模式 B + 受托处理合同）
店主在场完成登录/验证码，含 SLA 约定超时
测量并调优实际验证码/标记率（QA 循环）
发现实际的会话/MFA/锁定行为

第二阶段 — 多租户

技能库 → 热部署 → 集群。

技能库偏移 → 热部署修复至全集群
所有写操作均需人工审批
Rakuten Beauty 通过 http_api（文档 07）
安装/更新/支持工具链 + 健康仪表板
降级模式 + 最大过时阈值强制执行

始终遵守 — 不变量：使用 OS 输入或扩展驱动（绝不使用原生 Playwright-over-CDP）· 绝不使用 APIRequestContext · 仅限专用配置文件 · 代理绝不自动确认预订 · 反机器人升级停止并告警，绝不自修复 · 数据过时时禁止写入/扇出 · 每次技能晋升均有审计日志。

客户端本地代理 — 在店主自有设备上运行

本地执行带来了什么 — 以及我们需要攻克什么才能通过检测。

▸ 基础优势 — 已验证的胜利

数据中心 IP 硬性封锁已消除

TLS/JA3/JA4 + HTTP-2 指纹天然真实

店主在场完成登录/验证码

个人信息留在日本

▸ 构建重心 — 第一阶段的调优内容

IP 只是 Akamai 5+ 层检测中的一层

行为 + 意图-会话图谱的拟真度

多重登录（单一活动会话）

分发、信任与支持

成败关键的构建规格。

navigator.webdriver 自检

Chrome 136+ → 必须使用专用非默认 --user-data-dir

绝不可使用 Playwright APIRequestContext

§3a — OS 输入驱动是核心工程难点

替代驱动方案 — DOUKI 路线

需要精确区分："本地" ≠ "无传输"。

本地数据面 + 中央控制面。

数据过时是正确性缺陷，不只是运维问题。

心跳驱动的调度

常驻托管迷你 PC

租户级最大过时阈值

任何集群暴露前必须就绪。

成熟模式 — 可行性已确立。

DOUKI — 正是这一模型

有人值守的 RPA

browser-use / CDP 附加

确定的构建方案 — 不是可行性试探。

不访问 Salon Board。$0 成本。

测量并调优实际标记率。

技能库 → 热部署 → 集群。

`navigator.webdriver` 自检

Chrome 136+ → 必须使用专用非默认 `--user-data-dir`

绝不可使用 Playwright `APIRequestContext`