01先学接法,再看题THE METHOD
N-012 记录过一个亲历结论:Agent 岗位的面试追问几乎全落在五类上——项目真实性、工程边界、状态与恢复、轨迹与证据、成本与安全。这份底稿把五类摊开成三十问。但先说清一件事:三十问不是拿来背答案的,背答案恰恰是这类追问要淘汰的东西(N-012:"这些问题专杀背来的答案")。
要练的是同一个接法,四段:已实现(这块我做到了哪)→ 边界(哪没做、哪会挂)→ 后续(如果继续做,下一步是什么)→ 证据(README/trace/测试里哪一条能证明我刚才说的)。四段作答的效果在亲历中反复验证过:诚实分层一给出,追问会立刻从怀疑转向细节——这是好事,细节你有档案。
每一问下面的"接",都只是四段作答在那一问上的具体化。读的时候对着自己的项目想答案,想不出来的那几问,就是你项目证据链的洞——先补洞,再面试。
02真实性 · 六问AUTHENTICITY
开场第一刀几乎总在这里(N-012:"真实性是第一道门,还排在技术深度前面")。
- 这是课程作业、教程复刻,还是你自己设计的系统?——考任务定义是不是你立的。接:直说来源,然后立刻讲你在哪里离开了教程:改了什么决策、为什么改(F-008 的"改"就是护城河)。
- 哪些部分是你写的,哪些是 AI 写的?——考你对代码的所有权。接:按决策层/结果层拆(F-009 的词):架构和边界决策是我的,样板代码有 AI 参与,但每一段我都能解释为什么这样写。
- 哪些是 mock 的,哪些真实执行?——考诚实,也考你知不知道二者的差别。接:逐层点名,mock 的说清 mock 了什么、为什么(比如模型调用 mock 是为了省成本,执行链路是真的)。
- 怎么证明它真的跑得通?——考可验证性。接:给路径不给形容词——"克隆下来跑这条命令,五个测试全过;runs/ 目录里有带时间戳的 trace"。
- demo 视频之外,有什么活的证据?——考你懂不懂视频是最弱的轨迹(F-010 讲过)。接:日志、失败记录、可复跑的命令,任选其一现场展示。
- 如果我现在改一个输入,它还能对吗?——考系统是不是只为演示路径调优。接:诚实划界:"这三类输入稳定,这类没覆盖——它在我的边界声明里。"
03工具与边界 · 六问TOOLS & BOUNDARIES
Agent 项目特有的一组,考的是 F-006 的三层缰绳和 F-012 的房间思想在你项目里落了没有。
- 你的 Agent 怎么调用工具?——考基本功。接:讲清单机制:程序递工具清单,模型输出调用意图,执行在外层程序手里(F-006 的四步握手,用自己项目的名词讲一遍)。
- 怎么限制它能写哪些文件?——考文件墙。接:白名单/工作目录隔离/路径校验,说自己项目用的是哪种,再补一句"出界请求的处理我记录在案"。
- 怎么防它执行危险命令?——考你对"能力即风险"的意识。接:命令白名单或高危动作人工确认门(F-001 的门),最好能举一个真的被拦下的例子。
- 工具调用失败了怎么办?——考异常路径。接:重试几次、怎么退避、重试后仍失败落什么状态——答案在你的状态机里,不在临场发挥里。
- 为什么用/不用 MCP 或某框架?——考选型是判断还是跟风。接:给比较过的选项和放弃理由(F-010:"至少要能说出一个被你比较过再放弃的选项")。
- 如果给它更多权限,你最担心什么?——考边界想象力。接:按后果排序说两个真实担忧,各配一个缓解手段——这题答得好是加分项里最大的一个。
04状态与恢复 · 六问STATE & RECOVERY
只要项目里有异步任务或长流程,这组必来。考的是演示之外的最糟糕路径。
- 任务的状态怎么流转?——考模型基础。接:把自己的状态机背下来(如 pending→running→succeeded/failed),说清每条转移谁触发。
- 为什么需要 worker/队列,而不是同步执行?——考架构理由。接:长任务阻塞、失败重试、并发控制,挑你项目里真实成立的那条讲。
- worker 崩溃了怎么办?——考恢复设计。接:任务落库所以可恢复/超时标记失败/至少一次与至多一次的取舍——没做的就按四段法归入"边界+后续"。
- 同一个任务被执行两次会怎样?——考幂等意识。接:说清哪些操作幂等、哪些不是,不是的怎么防(去重键、状态检查)。
- 你的队列和生产级队列差在哪?——考你知不知道自己在哪一层。接:主动交代(比如"Redis List 是 MVP,不宣称 crash-safe"),再讲升级路径——这句"不宣称"本身就是成熟度信号。
- 如果任务卡住不动,你怎么发现?——考可观测性。接:超时机制、状态巡检、日志告警,做了哪个说哪个,都没做就承认并说该先做哪个、为什么。
05轨迹与证据 · 六问TRACE & EVIDENCE
这组和本站的证据方法论完全重合——如果你按 F-010 把四样东西留全了,这六问是送分题。
- 为什么要记 trace?——考动机而非实现。接:Agent 错在过程里,评价不能只看终点(F-001);出了错,trace 是从结果回溯到决策的唯一路径。
- 你的 trace 里具体有什么?——考做没做过。接:逐字段报菜名:每步的输入、决策、工具调用、返回、耗时——最好能当场翻一条真的给面试官看。
- artifact 和 trace 什么关系?——考分层。接:trace 是过程记录,artifact 是产物(patch/测试结果/报告),两者靠任务 ID 关联成链。
- 怎么知道输出是对的?——考验证方式(F-003 第三样)。接:独立于生成过程的检查——测试、对拍、校验脚本;引用 F-013 的话说就是"我有一张不换的考卷"。
- 失败的运行你留了吗?——考诚实的档案观。接:留了,而且失败记录比成功记录更有用——修复判断都从那里来(能现场指出一条最有价值的失败记录最好)。
- 给你三分钟,用证据说服我这个系统可信。——考组织能力。接:这就是四段作答的完整演出:README 定位 → 边界声明 → 跑一条命令 → 翻一条 trace。提前排练过和没排练过,差距一眼可见。
06成本与安全 · 六问COST & SAFETY
亲历里出现频率被低估的一组——很多人准备了算法和架构,却在"钱和钥匙"上失分。
- 怎么避免误调用真实模型烧钱?——考成本意识。接:mock/离线路径做默认,真实调用要显式开关加预算上限(F-004 的账在这里直接换分数)。
- API Key 怎么管?——考最基本的密钥卫生。接:环境变量或密钥管理,不进代码不进日志不进 git 历史——说完最好补一句"仓库可以搜给你看"。
- 怎么防它泄露用户代码/数据?——考数据流向意识。接:说清数据到过哪里(本地/哪家 API),没把握的环节明说没把握。
- 一次任务大概花多少钱?贵在哪一步?——考你算没算过账。接:给量级和构成(模型调用占大头/重读放大成本),没测过就说"没实测,但我知道怎么测"。
- 循环会不会失控?上限在哪?——考缰绳(F-001)。接:步数上限、超时、成本熔断,report 自己项目设的数字和为什么。
- 提示词注入你考虑过吗?——考安全视野。接:处理了就讲机制(输入过滤/工具白名单兜底),没处理就把它放进边界声明并说清风险场景——不装懂。
07接不住的时候WHEN YOU CAN'T
三十问总有几问落在你没做过的地方。接不住的标准动作仍是四段法的后两段:"这块我没做——因为当时判断 X 优先;如果做,我会从 Y 入手,先验证 Z。"一句话里有取舍、有路径、有验证意识,比一段磕磕绊绊的现编强得多。
反过来,最伤的答法是三种:把没做的说成做了(下一个追问就穿)、把 mock 说成真实(真实性一票否决)、用形容词代替证据("很稳定""性能很好"——追问"怎么测的"就断)。亲历复盘里,"生产级""完整平台"这类词一出口,追问立刻收紧——词越大,洞越深。
08连回判断TO THE NOTES
这份底稿是站内求职线的实战末端:面试为什么变成这样考,判断在 N-012 AI 时代的技术面试;发出去之前项目该怎么自检,见 F-010 两句追问测试;"怎么知道它对"的制度化版本,见 F-013 评测入门;四样东西的原始清单,见 F-003。
想对照一个把这些问题都预答过一遍的实物:P-001 和 P-006 的档案页就是按"被追问"的假设写的。
底稿负责把问题摊开;你的项目接不接得住,答案在你的台账里。