Stephanie Zhan · Thread Recap DOC—SEQ/STZ-2026 · seven-takes REV 2026·05·03 · a
— Seven Takes from AI Ascent 2026 · Sequoia GP Thread —

Floor/Ceiling/Judgment

Compiled by 2026·05·03 STATUS · RECAP
figure 00 · thesis Floor

Ceiling
↑↑↑

Sequoia GP Stephanie Zhan 在 AI Ascent 2026 跟 Karpathy 對談後,發了一條 7 則 tweet 的 thread 收斂。如果 Karpathy 的版本是「新典範會長出什麼」,這條 thread 就是builder / 投資人視角下的對照——「如果你正在這個典範裡蓋公司,你該注意什麼」。

核心對比:去年 Karpathy 創造 vibe coding 把寫程式的地板抬起來,更多人能蓋東西。今年的 agentic engineering 則是把天花板往上推——能不能在不犧牲 security、reliability、maintainability、taste 的情況下用 agent 把工程做到極致。Stephanie 的判斷是:天花板可能遠遠不只 10×

下面把 7 則 tweet 整理成 5 個 stage,每個 stage 左邊是延伸觀察、右邊是原句復現。

Vibe coding raised the floor. Agentic engineering raises the ceiling. The ceiling may be much higher than 10x.
— STEPHANIE ZHAN · TWEET 3/7 · AI ASCENT 2026
01/05
— Take 01 · The jaggedness is real
在不在 model 的 trained circuits 裡
同一個 frontier model 可以重構十萬行 code、找 zero-day,也會叫你走 50 公尺去洗車場洗車。Builders 該做的事:判斷自己的任務在不在電路內。
// IN-CIRCUIT vs OUT

Stephanie 第一條就把 jaggedness 立成 builder 的第一個過濾器:你想做的事到底在不在模型「被訓過、被驗過」的電路裡。

實務上這意味著兩件事:第一,demo 看起來神,不代表你的 use case 神——demo 通常踩中分布的 sweet spot;第二,愈早在自己領域跑可重複的小實驗,愈快畫出自己的 jagged map。

呼應 Karpathy 的解釋——電路內外的差別來自 verifiabilityeconomics 兩條軸:你的領域有沒有可驗證的 reward、有沒有大到足以被 lab 納入訓練菜單。在電路內就是飛行,在外面就是拿開山刀。

1 / 7 @stephzhan
The jaggedness is real.

A frontier model can refactor 100k lines of code, find zero-days, and look superhuman in one domain…

Then tell you to walk 50 meters, to a car wash, to wash your car!

What that means for builders? Figure out whether your task is inside the model's trained circuits, or outside them.

02/05
— Take 03 · Floor vs Ceiling
Vibe Coding ≠ Agentic Engineering — 一個抬地板,一個推天花板
Vibe coding 是「access」(更多人能蓋);agentic engineering 是「excellence」(不放棄安全、可靠、可維護、品味地用 agent)。天花板可能遠遠不只 10×。
// ACCESS vs EXCELLENCE

整條 thread 的辨識度最高的一條。Stephanie 把兩個常被混在一起的概念劃出明確分界:

Vibe coding 抬「地板」——把進入門檻拉低,更多原本不寫程式的人也能蓋東西。它解決的是「能不能開始」。

Agentic engineering 推「天花板」——讓有經驗的工程師在用 agent 的同時,仍守住 security / reliability / maintainability / taste。它解決的是「能不能做到極致」。

她的判斷:天花板可能遠遠不只 10×。對 builder 的訊號是:別把產品定位放在地板區(會被洪水淹沒),把資源壓在「沒人能複製的天花板」上。

3 / 7 @stephzhan
Vibe coding and agentic engineering are not the same thing.

Vibe coding raises the floor. Agentic engineering raises the ceiling.

One is about access: more people can build.

The other is about excellence: using agents without giving up security, reliability, maintainability, or taste.

The ceiling may be much higher than 10x.

FLOOR ↑
Vibe Coding
把進入門檻拉低 — 不會寫 code 的人也能 ship 東西。Access、democratization。
+
CEILING ↑↑↑
Agentic Engineering
資深工程師用 agent 把工程做到「不犧牲 security / reliability / maintainability / taste」的極致。Excellence、leverage。
+++
03/05
— Take 02 + 05 · Up the Stack · Judgment
人往上爬一層 — 從做事 → 理解與指揮
「你可以外包思考,但不能外包理解。」AI 寫的 code 常常 work,那不代表 good。判斷力(何時簡化、何時刪除、抽象錯了沒)仍然是稀缺技能。
// HUMAN-IN-LOOP

第二條與第五條合起來看最有力:當 agent 可以執行、搜尋、總結、寫 code、迭代之後,人的角色不是消失,而是往上爬一層——從「做這件事」轉到「理解什麼重要、什麼為真、要蓋什麼、為什麼蓋」。

第五條補上實際後果:AI 生成的 code 常常會跑(compile、pass test),但常常是臃腫、複製貼上、脆弱、抽象彆扭的。「working」不代表「good」

所以稀缺技能仍然是判斷力——知道何時要簡化、何時該刪、何時抽象錯了、何時 working 還不夠。這也是為什麼天花板可以拉到 10× 之上:能把這四件事做好的工程師,配上 agent 的執行力,產出曲線陡升。

2 / 7 @stephzhan
"You can outsource your thinking, but you can't outsource your understanding."

Agents can execute, search, summarize, code, and iterate.

But someone still has to know what matters, what is true, what to build, and why.

The human role moves up the stack: from doing the work to understanding and directing it.

L4Direct · 為什麼要做、由誰做、何時 stopHUMAN
L3Understand · 什麼為真、什麼有意義、抽象對不對HUMAN
L2Iterate · 試錯、產生變體、跑 benchmarkAGENT
L1Execute · 寫 code、搜尋、總結、修改AGENT
5 / 7 @stephzhan
AI generated code often works. That does not mean it is good.

It can be bloated, copy-paste heavy, brittle, and awkwardly abstracted.

The scarce skill is still judgment: knowing when to simplify, when to delete, when the abstraction is wrong, and when "working" is not enough.

04/05
— Take 04 · Hiring has not caught up
Hiring 該換題目 — 從 toy puzzle 到 ship a real system
想招 agentic engineer,玩具題目是錯的測試。給真的專案、給工具、要他部署,再用 agent 嘗試打破。新問題不是「能不能解題」,而是「ship 出來的系統能不能撐過跟現實的接觸」。
// SURVIVE REALITY

當工程師的執行力被 agent 放大之後,hiring 還停在 LeetCode-style 的 toy puzzle 是錯誤校準——你篩出來的能力不是你需要的能力。

Stephanie 提的新做法很直白:給候選人一個真的專案 → 讓他用工具 → 要他部署 → 然後用 agent 嘗試把它打破。這個流程同時測四件事:理解需求、整合工具、shipping discipline、與 agent 對抗的韌性。

新問題從「can you solve the problem」轉到 「can you ship a system that survives contact with reality」。後者是 agentic engineering 的核心試煉:在 agent 把「會動」變成 commodity 之後,「能不能撐住」變成新的差異點。

4 / 7 @stephzhan
Hiring has not caught up.

If you want to hire agentic engineers, toy puzzles are the wrong test.

Give candidates a real project. Let them use the tools. Make them deploy it. Then try to break it with agents.

The question is no longer just: can you solve the problem?

It's: can you ship a system that survives contact with reality?

OLD · Toy Puzzle
解題能力 in vacuum
封閉題目、白板演算法、邊界條件清楚。能解 → 通過。問題:跟 production 的距離很遠。
NEW · Real Project
Ship + Survive Reality
真專案 × 真工具 × 真部署 × agent 對抗。測的是整合、品味、debug、防禦性思考。
05/05
— Take 06 + 07 · SW 3.0 · Neural-First
AI ≠「更好的軟體」— 新典範裡能蓋「以前不可能存在」的東西
Karpathy 的 SW 3.0 重點:我們可能進入新的計算典範。被低估的問題不是「哪個既有 workflow 變快」,而是「現在能蓋哪些之前根本不可能存在的東西?」未來甚至可能 NN 當 host process、CPU 退到 coprocessor。
// NEW SUBSTRATE

第六條呼應 Karpathy 的 software 3.0 觀點,但 Stephanie 把它翻成 builder 的提問校準:別老問「我哪個 workflow 會變快」,那是把 LLM 當引擎升級。要問「現在能蓋什麼之前根本不可能存在的東西?」那才是 paradigm shift 該問的問題。

第七條更激進:今天 model 是virtualized 跑在古典電腦上的——CPU host、NN guest。Karpathy 想像的未來是顛倒過來——NN 當 host、CPU 退到 coprocessor 處理 deterministic tool use

Stephanie 收斂時加上一句很 Karpathy 的 disclaimer:「Strange now. Maybe obvious later :)」。這就是新典範該被討論的方式——現在聽起來奇怪,未來回頭看是顯然。

6 / 7 @stephzhan
AI is not just "better software."

Karpathy's Software 3.0 point is that we may be entering a new computing paradigm.

The underrated question is not just: what existing workflow gets faster?

It's: what can we now build that literally could not exist before?

7 / 7 @stephzhan
Neural nets may become the host process.

Today, models run virtualized on classical computers.

But Karpathy imagines a future where the neural net does most of the heavy lifting… and CPUs become coprocessors for deterministic tool use.

Strange now. Maybe obvious later :)

NOW · 2026
CPU 是 host,NN 是 virtualized guest。古典程式包著模型呼叫,model 是工具之一。
FUTURE · ???
NN 是 host process,CPU 變 coprocessor,只負責 deterministic tool use。Substrate 翻轉。
Wrong question
What existing workflow gets faster?
Right question
What can we now build that literally could not exist before?
— GP TAKE / SUMMARY —

別優化地板/把資源砸在天花板

Stephanie 的 7 則 thread 收成一句話:地板已經被 vibe coding 抬高,那是 commodity 戰場;真正的 alpha 在天花板。判斷你的任務在不在 model 電路裡(take 1)、把人放到 stack 上層做理解與判斷(take 2 / 5)、押上 agentic engineering 而不是只追 vibe coding(take 3)、用「ship-survives-reality」重寫招聘(take 4)、用「之前不可能存在的東西」當提問校準(take 6 / 7)。地板會繼續往上抬,但天花板的高度,由你怎麼用 agent 決定。

Further Reading 延伸閱讀