Agent 项目面试的三十次追问

01先学接法，再看题THE METHOD

N-012 记录过一个亲历结论：Agent 岗位的面试追问几乎全落在五类上——项目真实性、工程边界、状态与恢复、轨迹与证据、成本与安全。这份底稿把五类摊开成三十问。但先说清一件事：三十问不是拿来背答案的，背答案恰恰是这类追问要淘汰的东西（N-012："这些问题专杀背来的答案"）。

要练的是同一个接法，四段：已实现（这块我做到了哪）→ 边界（哪没做、哪会挂）→ 后续（如果继续做，下一步是什么）→ 证据（README/trace/测试里哪一条能证明我刚才说的）。四段作答的效果在亲历中反复验证过：诚实分层一给出，追问会立刻从怀疑转向细节——这是好事，细节你有档案。

每一问下面的"接"，都只是四段作答在那一问上的具体化。读的时候对着自己的项目想答案，想不出来的那几问，就是你项目证据链的洞——先补洞，再面试。

02真实性 · 六问AUTHENTICITY

开场第一刀几乎总在这里（N-012："真实性是第一道门，还排在技术深度前面"）。

这是课程作业、教程复刻，还是你自己设计的系统？——考任务定义是不是你立的。接：直说来源，然后立刻讲你在哪里离开了教程：改了什么决策、为什么改（F-008 的"改"就是护城河）。
哪些部分是你写的，哪些是 AI 写的？——考你对代码的所有权。接：按决策层/结果层拆（F-009 的词）：架构和边界决策是我的，样板代码有 AI 参与，但每一段我都能解释为什么这样写。
哪些是 mock 的，哪些真实执行？——考诚实，也考你知不知道二者的差别。接：逐层点名，mock 的说清 mock 了什么、为什么（比如模型调用 mock 是为了省成本，执行链路是真的）。
怎么证明它真的跑得通？——考可验证性。接：给路径不给形容词——"克隆下来跑这条命令，五个测试全过；runs/ 目录里有带时间戳的 trace"。
demo 视频之外，有什么活的证据？——考你懂不懂视频是最弱的轨迹（F-010 讲过）。接：日志、失败记录、可复跑的命令，任选其一现场展示。
如果我现在改一个输入，它还能对吗？——考系统是不是只为演示路径调优。接：诚实划界："这三类输入稳定，这类没覆盖——它在我的边界声明里。"

03工具与边界 · 六问TOOLS & BOUNDARIES

Agent 项目特有的一组，考的是 F-006 的三层缰绳和 F-012 的房间思想在你项目里落了没有。

你的 Agent 怎么调用工具？——考基本功。接：讲清单机制：程序递工具清单，模型输出调用意图，执行在外层程序手里（F-006 的四步握手，用自己项目的名词讲一遍）。
怎么限制它能写哪些文件？——考文件墙。接：白名单/工作目录隔离/路径校验，说自己项目用的是哪种，再补一句"出界请求的处理我记录在案"。
怎么防它执行危险命令？——考你对"能力即风险"的意识。接：命令白名单或高危动作人工确认门（F-001 的门），最好能举一个真的被拦下的例子。
工具调用失败了怎么办？——考异常路径。接：重试几次、怎么退避、重试后仍失败落什么状态——答案在你的状态机里，不在临场发挥里。
为什么用/不用 MCP 或某框架？——考选型是判断还是跟风。接：给比较过的选项和放弃理由（F-010："至少要能说出一个被你比较过再放弃的选项"）。
如果给它更多权限，你最担心什么？——考边界想象力。接：按后果排序说两个真实担忧，各配一个缓解手段——这题答得好是加分项里最大的一个。

04状态与恢复 · 六问STATE & RECOVERY

只要项目里有异步任务或长流程，这组必来。考的是演示之外的最糟糕路径。

任务的状态怎么流转？——考模型基础。接：把自己的状态机背下来（如 pending→running→succeeded/failed），说清每条转移谁触发。
为什么需要 worker/队列，而不是同步执行？——考架构理由。接：长任务阻塞、失败重试、并发控制，挑你项目里真实成立的那条讲。
worker 崩溃了怎么办？——考恢复设计。接：任务落库所以可恢复/超时标记失败/至少一次与至多一次的取舍——没做的就按四段法归入"边界+后续"。
同一个任务被执行两次会怎样？——考幂等意识。接：说清哪些操作幂等、哪些不是，不是的怎么防（去重键、状态检查）。
你的队列和生产级队列差在哪？——考你知不知道自己在哪一层。接：主动交代（比如"Redis List 是 MVP，不宣称 crash-safe"），再讲升级路径——这句"不宣称"本身就是成熟度信号。
如果任务卡住不动，你怎么发现？——考可观测性。接：超时机制、状态巡检、日志告警，做了哪个说哪个，都没做就承认并说该先做哪个、为什么。

05轨迹与证据 · 六问TRACE & EVIDENCE

这组和本站的证据方法论完全重合——如果你按 F-010 把四样东西留全了，这六问是送分题。

为什么要记 trace？——考动机而非实现。接：Agent 错在过程里，评价不能只看终点（F-001）；出了错，trace 是从结果回溯到决策的唯一路径。
你的 trace 里具体有什么？——考做没做过。接：逐字段报菜名：每步的输入、决策、工具调用、返回、耗时——最好能当场翻一条真的给面试官看。
artifact 和 trace 什么关系？——考分层。接：trace 是过程记录，artifact 是产物（patch/测试结果/报告），两者靠任务 ID 关联成链。
怎么知道输出是对的？——考验证方式（F-003 第三样）。接：独立于生成过程的检查——测试、对拍、校验脚本；引用 F-013 的话说就是"我有一张不换的考卷"。
失败的运行你留了吗？——考诚实的档案观。接：留了，而且失败记录比成功记录更有用——修复判断都从那里来（能现场指出一条最有价值的失败记录最好）。
给你三分钟，用证据说服我这个系统可信。——考组织能力。接：这就是四段作答的完整演出：README 定位 → 边界声明 → 跑一条命令 → 翻一条 trace。提前排练过和没排练过，差距一眼可见。

06成本与安全 · 六问COST & SAFETY

亲历里出现频率被低估的一组——很多人准备了算法和架构，却在"钱和钥匙"上失分。

怎么避免误调用真实模型烧钱？——考成本意识。接：mock/离线路径做默认，真实调用要显式开关加预算上限（F-004 的账在这里直接换分数）。
API Key 怎么管？——考最基本的密钥卫生。接：环境变量或密钥管理，不进代码不进日志不进 git 历史——说完最好补一句"仓库可以搜给你看"。
怎么防它泄露用户代码/数据？——考数据流向意识。接：说清数据到过哪里（本地/哪家 API），没把握的环节明说没把握。
一次任务大概花多少钱？贵在哪一步？——考你算没算过账。接：给量级和构成（模型调用占大头/重读放大成本），没测过就说"没实测，但我知道怎么测"。
循环会不会失控？上限在哪？——考缰绳（F-001）。接：步数上限、超时、成本熔断，report 自己项目设的数字和为什么。
提示词注入你考虑过吗？——考安全视野。接：处理了就讲机制（输入过滤/工具白名单兜底），没处理就把它放进边界声明并说清风险场景——不装懂。

07接不住的时候WHEN YOU CAN'T

三十问总有几问落在你没做过的地方。接不住的标准动作仍是四段法的后两段："这块我没做——因为当时判断 X 优先；如果做，我会从 Y 入手，先验证 Z。"一句话里有取舍、有路径、有验证意识，比一段磕磕绊绊的现编强得多。

反过来，最伤的答法是三种：把没做的说成做了（下一个追问就穿）、把 mock 说成真实（真实性一票否决）、用形容词代替证据（"很稳定""性能很好"——追问"怎么测的"就断）。亲历复盘里，"生产级""完整平台"这类词一出口，追问立刻收紧——词越大，洞越深。

08连回判断TO THE NOTES

这份底稿是站内求职线的实战末端：面试为什么变成这样考，判断在 N-012 AI 时代的技术面试；发出去之前项目该怎么自检，见 F-010 两句追问测试；"怎么知道它对"的制度化版本，见 F-013 评测入门；四样东西的原始清单，见 F-003。

想对照一个把这些问题都预答过一遍的实物：P-001 和 P-006 的档案页就是按"被追问"的假设写的。

底稿负责把问题摊开；你的项目接不接得住，答案在你的台账里。