Floor/Ceiling/Judgment
↑
Ceiling
↑↑↑
Sequoia GP Stephanie Zhan 在 AI Ascent 2026 跟 Karpathy 對談後,發了一條 7 則 tweet 的 thread 收斂。如果 Karpathy 的版本是「新典範會長出什麼」,這條 thread 就是builder / 投資人視角下的對照——「如果你正在這個典範裡蓋公司,你該注意什麼」。
核心對比:去年 Karpathy 創造 vibe coding 把寫程式的地板抬起來,更多人能蓋東西。今年的 agentic engineering 則是把天花板往上推——能不能在不犧牲 security、reliability、maintainability、taste 的情況下用 agent 把工程做到極致。Stephanie 的判斷是:天花板可能遠遠不只 10×。
下面把 7 則 tweet 整理成 5 個 stage,每個 stage 左邊是延伸觀察、右邊是原句復現。
Vibe coding raised the floor. Agentic engineering raises the ceiling. The ceiling may be much higher than 10x.
Stephanie 第一條就把 jaggedness 立成 builder 的第一個過濾器:你想做的事到底在不在模型「被訓過、被驗過」的電路裡。
實務上這意味著兩件事:第一,demo 看起來神,不代表你的 use case 神——demo 通常踩中分布的 sweet spot;第二,愈早在自己領域跑可重複的小實驗,愈快畫出自己的 jagged map。
呼應 Karpathy 的解釋——電路內外的差別來自 verifiability 與 economics 兩條軸:你的領域有沒有可驗證的 reward、有沒有大到足以被 lab 納入訓練菜單。在電路內就是飛行,在外面就是拿開山刀。
A frontier model can refactor 100k lines of code, find zero-days, and look superhuman in one domain…
Then tell you to walk 50 meters, to a car wash, to wash your car!
What that means for builders? Figure out whether your task is inside the model's trained circuits, or outside them.
整條 thread 的辨識度最高的一條。Stephanie 把兩個常被混在一起的概念劃出明確分界:
Vibe coding 抬「地板」——把進入門檻拉低,更多原本不寫程式的人也能蓋東西。它解決的是「能不能開始」。
Agentic engineering 推「天花板」——讓有經驗的工程師在用 agent 的同時,仍守住 security / reliability / maintainability / taste。它解決的是「能不能做到極致」。
她的判斷:天花板可能遠遠不只 10×。對 builder 的訊號是:別把產品定位放在地板區(會被洪水淹沒),把資源壓在「沒人能複製的天花板」上。
Vibe coding raises the floor. Agentic engineering raises the ceiling.
One is about access: more people can build.
The other is about excellence: using agents without giving up security, reliability, maintainability, or taste.
The ceiling may be much higher than 10x.
第二條與第五條合起來看最有力:當 agent 可以執行、搜尋、總結、寫 code、迭代之後,人的角色不是消失,而是往上爬一層——從「做這件事」轉到「理解什麼重要、什麼為真、要蓋什麼、為什麼蓋」。
第五條補上實際後果:AI 生成的 code 常常會跑(compile、pass test),但常常是臃腫、複製貼上、脆弱、抽象彆扭的。「working」不代表「good」。
所以稀缺技能仍然是判斷力——知道何時要簡化、何時該刪、何時抽象錯了、何時 working 還不夠。這也是為什麼天花板可以拉到 10× 之上:能把這四件事做好的工程師,配上 agent 的執行力,產出曲線陡升。
Agents can execute, search, summarize, code, and iterate.
But someone still has to know what matters, what is true, what to build, and why.
The human role moves up the stack: from doing the work to understanding and directing it.
It can be bloated, copy-paste heavy, brittle, and awkwardly abstracted.
The scarce skill is still judgment: knowing when to simplify, when to delete, when the abstraction is wrong, and when "working" is not enough.
當工程師的執行力被 agent 放大之後,hiring 還停在 LeetCode-style 的 toy puzzle 是錯誤校準——你篩出來的能力不是你需要的能力。
Stephanie 提的新做法很直白:給候選人一個真的專案 → 讓他用工具 → 要他部署 → 然後用 agent 嘗試把它打破。這個流程同時測四件事:理解需求、整合工具、shipping discipline、與 agent 對抗的韌性。
新問題從「can you solve the problem」轉到 「can you ship a system that survives contact with reality」。後者是 agentic engineering 的核心試煉:在 agent 把「會動」變成 commodity 之後,「能不能撐住」變成新的差異點。
If you want to hire agentic engineers, toy puzzles are the wrong test.
Give candidates a real project. Let them use the tools. Make them deploy it. Then try to break it with agents.
The question is no longer just: can you solve the problem?
It's: can you ship a system that survives contact with reality?
第六條呼應 Karpathy 的 software 3.0 觀點,但 Stephanie 把它翻成 builder 的提問校準:別老問「我哪個 workflow 會變快」,那是把 LLM 當引擎升級。要問「現在能蓋什麼之前根本不可能存在的東西?」那才是 paradigm shift 該問的問題。
第七條更激進:今天 model 是virtualized 跑在古典電腦上的——CPU host、NN guest。Karpathy 想像的未來是顛倒過來——NN 當 host、CPU 退到 coprocessor 處理 deterministic tool use。
Stephanie 收斂時加上一句很 Karpathy 的 disclaimer:「Strange now. Maybe obvious later :)」。這就是新典範該被討論的方式——現在聽起來奇怪,未來回頭看是顯然。
Karpathy's Software 3.0 point is that we may be entering a new computing paradigm.
The underrated question is not just: what existing workflow gets faster?
It's: what can we now build that literally could not exist before?
Today, models run virtualized on classical computers.
But Karpathy imagines a future where the neural net does most of the heavy lifting… and CPUs become coprocessors for deterministic tool use.
Strange now. Maybe obvious later :)
別優化地板/把資源砸在天花板
Stephanie 的 7 則 thread 收成一句話:地板已經被 vibe coding 抬高,那是 commodity 戰場;真正的 alpha 在天花板。判斷你的任務在不在 model 電路裡(take 1)、把人放到 stack 上層做理解與判斷(take 2 / 5)、押上 agentic engineering 而不是只追 vibe coding(take 3)、用「ship-survives-reality」重寫招聘(take 4)、用「之前不可能存在的東西」當提問校準(take 6 / 7)。地板會繼續往上抬,但天花板的高度,由你怎麼用 agent 決定。