三份真 shift · 看 ZeroU 怎么开的工

demo 跑通了。
product  24 

ZeroU 不替你写完「最后那点 product 代码」。它先扫你的demo、派agent干活 — 4 层 reviewer 过了才合 main。

一份真 shift。1h 31min · $4.24 · 合 2 / 公示 24 · 没藏。

↓ 看 1h 31min 真跑 macOS · Windows · 自带 LLM key · 不上传代码
  1. static gate tsc · npm test · build
  2. alignment 是否对题 / scope creep
  3. behavioral approach 是否扎实
  4. adversarial 攻击向量 N 条
  • 本地优先
  • 自带 LLM key
  • 4 层 reviewer
  • MIT 开源

ZeroU 一晚做了什么 · 三段 shift 记录

夜班记录 · 01 10:11 PM · setup · 28 项 preset 落库

给一个 folder。它自己读完了

subject:agent-game-platform · 一个扑克观赏 demo。ZeroU 5 轮 elicit 把 vision 沉到 vision.md。下面是它手里的三样。

一 · 项目类型
detector · haiku · 0.95 confidence
{
  "type": "saas-web",
  "confidence": 0.95,
  "evidence": [
    "Next.js + Bun + Supabase",
    "Auth routes",
    "Playwright e2e"
  ]
}
扫了 manifest + README + tree
二 · 你的 vision
vision · 5 轮 A/B/C · 写进 vision.md
## 产品定位
竞技化的德州扑克
观赏与社交平台 —
让玩家在看牌、讨论、
交流中感受真实牌局
氛围。

## 商业模式
抽水 (rake)。
## KPI
DAU / MAU ≥ 30%
vision.md · 90 行 · 在你本地
三 · 你的 preset
saas-web · 28 项验收清单
[done]    auth-signup       Supabase
[done]    auth-session      HttpOnly
[done]    db-real           Postgres
[done]    err-handler       Sentry
[missing] auth-csrf         待验证
[missing] auth-recovery     未实现
[missing] db-backup         无文档
[missing] ci-pipeline       不存在
...还有 12 项 partial / missing
8/28 done · 12 partial · 8 missing

夜班记录 · 02 11:13 PM · fix #27 过 4 层

AI 写代码。交给 AI 审 4 次

gap:docs-changelog-missing · implementer 写完 commit。4 道全开:语法过吗?对题吗?思路扎实吗?攻得动吗?都过了才合 main。

fix #27 · commit 5aedd6e
+ CHANGELOG.md (新增)
+ 39 行
- 0 行

gap.slug:
  docs-changelog-missing
gap.severity: P3
gap.category: docs
implementer · sonnet · 一次成稿
static gate
tsc · npm test · build

「typecheck 没碰到。test 跑了 41 个全过。build 干净。」

PASSED · 0 errors
alignment
haiku · 对题快检

「写的就是 CHANGELOG。没动别处。score 0.98。」

PASSED · 0.98 / 0.7 阈值
behavioral
sonnet · fresh context 深审

「conventional changelog 格式,日期对的,版本号在 manifest 里能对上。APPROVE。」

APPROVE · 88% confidence
adversarial
sonnet · 攻击视角

「这是 docs 改动,不在高敏 category(auth/sql/crypto),不触发。直接放行。」

SKIPPED · low sensitivity

夜班记录 · 03 做不到的事 · 写在 PR 里

不偷偷塞。做不到的全公示

AI 写代码的暗病:.skip 测试、@ts-ignore、关 CSRF、藏 vision 不一致。ZeroU 反着来 — reviewer 拒掉的全进 NEED_HUMAN,写进 PR body。下面是同一 session 的两种"交付"。

不是这样
他人模式 · 偷偷塞

「session #4 — 28 项全 ✓,fix 全 merged。Enhanced! ✨」

↑ 实际:auth-csrf 被 .skip 了 / db-backup-path 用 @ts-ignore 跳过 / 24 项 vision-不一致都没说
这是 marketing 干的事,不是工程干的事。
这样才对
ZEROU · 写进 PR body

「session #4 · 1h 31min · cost $4.24 · merged: 2 · NEED_HUMAN: 24 项 — 每一项都附 reviewer 拒掉的原因。」

↑ PR body 第三段:全部 24 项 · slug · severity · reason_code
你 review PR 的人,一眼看见它做不到什么。
posted · session #4 24 件 ZeroU 做不到的事 · 写进 PR body
  1. + 14 more · all NEED_HUMAN in PR body
每条都附 reason code · reviewer 拒掉的理由不藏。
REAL PR BODY github.com/anzy-renlab-ai/agent-game-platform/pull/6
## Other gaps in this session (24 not in this PR)

These were surfaced by the differ but the reviewer pipeline
rejected the auto-fix. Marked `NEED_HUMAN` in this session's
state; left for you to triage.

- `auth-csrf-protection`         (P1) — reviewer marked INCOMPLETE
- `auth-password-recovery`       (P1) — retry budget exhausted
- `db-backup-path`               (P2) — reviewer marked BUGGY
- `db-migrations`                (P2) — reviewer marked INCOMPLETE
- `tests-smoke`                  (P1) — alignment score below 0.7
- `tests-unit`                   (P2) — reviewer marked INCOMPLETE
- `deploy-env-doc`               (P1) — implementer returned empty edits
- `ci-pipeline`                  (P2) — retry budget exhausted
- `ui-loading-states`            (P2) — alignment scope creep
- `ui-empty-states`              (P2) — reviewer marked INCOMPLETE
...还有 14 项

---
d2p session #4, base `main` · cost ~$4.24
See `.d2p/session-summary.md` in the repo for the full run log.
— 你 review 的不是"它做了什么",是"它做不到什么"。

实时 · 03.5 不点 play · 它就在跑

看 ZeroU 现在 在做什么。

产品 UI mini 版。32 秒一个循环:differ → implementer → 4 层 reviewer → merge / NEED_HUMAN。真 sha、真 PR。


看带 · 04 1h 31min 压到 60 秒

看一眼 1h 31min 的真班次。

无旁白 · 真数据 · 真 sha · 真 PR · 真评分。

duration1h 31min
cost$4.24
merged2 / 28
need_human24 公示

回放 · 04.5 一晚的 shift · 压成 8 秒

22:11 → 23:43。1h 31min 压到 8 秒。

replay · overnight shift 22:11 → 23:43 1h 31min · $4.24 · 2 merged · 24 NEED_HUMAN
22:11
commits to main
  1. 5aedd6edocs: add CHANGELOG.md22:34
  2. 3d2ad5fchore: env example23:02
  3. 53df272PR opened · 4 reviewers23:18
  4. 4b58841PR lists 24 NEED_HUMAN23:41
cost$0.00
merged0
need_human0
无旁白 · 真数据 · 1.5 倍速回放 1h 31min。

机制 · 05 为什么 4 道 · 不是 1 道

每个 fix 走 4 道门。才能合 main。

单 LLM 自审有盲区——它判不出自己。4 个角色 + 4 份 fresh context 把盲区切碎。一道不过 — fix 回退或升级 NEED_HUMAN。

live · pipeline oscilloscope fix #27 · docs-changelog-missing
incoming·
  1. G1static gatetsc · test · build
  2. G2alignmenthaiku · 对题
  3. G3behavioralsonnet · fresh
  4. G4adversarial攻击向量
— waiting —
一片亮 = 一条 fix。绿到底 = merged。红 = NEED_HUMAN。
  1. G1.

    不是 AI · 是命令行。

    tsc --noEmit · npm test · npm run build 。跑不过的 fix 根本进不了下一道。

    static gate
  2. G2.

    对题快检 · 不偏题、不 scope creep。

    haiku quick pass:写的是 vision 要的吗?顺手改了别的吗?score < 0.7 驳回。

    alignment
  3. G3.

    思路审核 · approach 扎不扎实。

    sonnet · fresh context · 从零看 diff。四档 verdict:APPROVE / RETRY / ROLLBACK / SPLIT。失败给重试提示。

    behavioral
  4. G4.

    攻击视角 · 能不能打穿。

    高敏 category(auth/sql/crypto)才触发。sonnet 出 N 条 vector,一条 BREAK 整 fix rollback。

    adversarial
live · orchestrator dispatch 6 agent · 0 / ∞ dispatch
ZeroU orchestrator
  • detectorhaikuidle
  • differsonnetidle
  • implementersonnetidle
  • reviewer · staticcliidle
  • reviewer · alignhaikuidle
  • done-checksonnetidle
中心派单 · agent 接活 · verdict 回执 · 不停转。

不可撤销 · 06 v1 不会让步的五条

5 件不可撤销的事。

改任意一条意味着 ZeroU 不再是 ZeroU。

  1. 01.

    双绿才停。

    preset 全部 done + vision verdict YES。少一个绿 — 不 SESSION_DONE。

  2. 02.

    NEED_HUMAN 写进 PR body。

    reviewer 拒掉的 gap 不藏。每个 PR 自带"做不到的事"+ reason code。review 的是诚实 delta。

  3. 03.

    4 道 reviewer 一道不能少。

    不是配置项。static / alignment / behavioral / adversarial 全开。这是它存在的理由。

  4. 04.

    本地 daemon · 代码不离机。

    不是云服务。daemon 在你电脑跑。worktree 在你磁盘写。merge 在你本地 git。我们手里没你的代码。

  5. 05.

    全开源 · 你的 LLM key。

    MIT · 自带 LLM key · 零后端 · 没 SaaS 转身位。删了就是全删,我们手里不留。

一句话讲完

它派 6 个 agent
它跑 4 层 reviewer
一晚把 demo 推到 product。
做不到的,写进 PR

本地优先 · 自带 LLM key

克隆一份,跑一次。

5 MB daemon · macOS · Windows · Linux · cc 不上传 · 仓库不外发。删 app 就是全删 — 我们手里没你的东西。

ZeroU · 克隆仓库 github · MIT → 看真 PR #6
git clone https://github.com/Upp-Ljl/d2p