新視野/Jaggedness/Agent-Native
just
faster.
Different.
Karpathy 在 Sequoia Ascent 2026 的 fireside chat 串了三個主題。第一個主題:每次新典範轉移,最容易被想到的都是「把舊有東西做得更快」——LLM 加速 coding、加速寫文件。但這次的真正趣味在於那些在舊典範裡根本不該存在、或根本不可能的功能。
第二個主題:理解 LLM 的jaggedness——同一個 artifact 可以一邊優雅地重構十萬行 codebase,一邊一本正經地叫你走去洗車場洗車。Karpathy 把這條光譜的成因從「verifiability」延伸到「economics」:你的任務有沒有進到 RL 訓練分布,決定了你是搭著電路飛行還是拿開山刀走叢林。
第三個主題:agent-native economy——把產品與服務拆解成 sensors、actuators、logic 三件,跨 1.0/2.0/3.0 三種計算典範重新組裝;以及未來可能由神經網路擔綱、CPU 退居 coprocessor 的新秩序。
同一個 artifact 可以重構十萬行 codebase,也可以叫你走去洗車場洗你的車。要在這種跳躍中精準使用 LLM,得同時看 verifiability 與 economics 兩條軸。
menugen 是 Karpathy 用來戳破「LLM 只是 code 加速器」這個錯覺的範例:應用本身的 input 是一張圖、output 也是一張圖,中間的處理 LLM 可以原生做完,不用再寫一堆解析、格式、規則程式。
關鍵不是「menugen 解決什麼問題」,而是它代表的一種應用形態——舊典範裡你會自然反射地去寫 OCR、parsing、模板渲染,這些在 LLM-native 裡根本不該存在。應用的邊界從程式碼,搬到了模型的 capability surface。
這對工程師的訊號是:每次設計新功能前,先問一句「這件事如果被一個夠強的 LLM 原生吞下,整個 codebase 還剩多少?」答案常常會是「少得驚人」。
過去要安裝一個工具,你要寫 install.sh——對 macOS / Ubuntu / Arch 各寫一段,處理 PATH、相依套件、版本邊界,每加一個發行版就多一段 if-elif。
Karpathy 提的新做法很簡單:寫一份 install.md,把該做什麼用英文寫清楚,告訴使用者「直接把這份貼給你的 LLM」。LLM 是一個高階英文 interpreter——它會根據你電腦的實際狀態調整步驟、遇到錯誤即時 debug、處理你的 shell 與 package manager 變體。
這是「用語言取代腳本」的最小可行範例,但它指向一個更大的方向:很多用 software 1.0 撐起來的膠水程式,會被自然語言介面取代。LLM 是新的 shell。
第三種新視野最有趣:不是「比以前更快」,而是「以前根本做不到」。LLM knowledge base 就是這類例子——你給它任意來源、任意格式的非結構化知識(純文字文章、PDF、會議逐字稿、論壇討論串、雜亂的內部文件),它能對這團東西做推理與計算。
古典 software 1.0 沒辦法做這件事——你會卡在 schema 設計、資料清洗、格式對齊,最後只能勉強處理幾種預先定義好的型態。computation over unstructured knowledge from arbitrary sources,這個句子本身就是 LLM 帶來的新原語。
這是 paradigm shift 真正的份量所在:兩個是「不該存在的」(menugen、install.md),一個是「以前不可能」的(knowledge base)。新典範的能量大半在這兩種——而不是「把舊有東西做得更快」。
LLM 的能力分布從來不是一條平滑曲線。同一個 artifact 可以同時做出:一個漂亮重構十萬行 codebase 與 叫你走去洗車場洗車 這種顯然錯離的建議。Karpathy 在這裡更新他的解釋。
第一條軸他之前寫過:verifiability——任務有沒有可自動驗證的 reward signal,決定了 RL 過程能不能反覆把模型逼到正確答案。可驗證 → 進得了 RL 循環 → 模型變強。難驗證 → 只能靠模仿 → 表現參差。
這次他補上第二條軸:economics——前沿實驗室會根據營收 / TAM 來決定要把哪些任務「打包進 RL 訓練分布」。Coding、math、tool use 有錢、有 benchmark、有 enterprise 需求,當然進得了菜單;很多冷僻或低 TAM 的領域則不會被優先納入。
這兩條軸合起來告訴你:你在 RL 電路上飛行,還是在叢林裡拿開山刀,往往不是模型「能不能做」的問題,而是「有沒有人付錢讓它被訓練到」的問題。
當 LLM agent 真的能跑進企業流程,產品不再是 monolithic 的「網站 + DB + UI」。Karpathy 提的拆解方式是sensors / actuators / logic——任何產品或服務都可以重新被想成「這三件分別是什麼,分別由誰負責」。
這三件可以分散到 software 1.0(人手寫的 code)、2.0(神經網路 weights)、3.0(LLM 提示詞與 agent skills)三種典範上。誰擅長什麼就由誰承擔——例如確定性轉換仍交給 1.0,感知多半進 2.0,推理與決策多半進 3.0。
連帶出現的是 agentic engineering 這套新技能:把資訊變得對 LLM「最大可讀」、設計給 agent 看的介面與文件、設計 agent 工作流的安全護欄、訂出新的 hiring 標準。Karpathy 也丟了一個更激進的暗示——未來大半計算可能由神經網路擔綱,CPU 退居 coprocessor。
不該存在/之前不可能/重新分解
Karpathy 把這場 fireside 收成三個動作:第一,去找本來不該存在或之前不可能的應用——別只把 LLM 當加速器;第二,用 verifiability × economics 兩條軸來預測你的 use case 在 jaggedness 光譜上的位置——不要被一個漂亮 demo 騙走判斷;第三,把產品重新拆解為 sensors · actuators · logic,跨 1.0 / 2.0 / 3.0 三種典範重新組裝,準備迎接神經為主、CPU 為輔的計算秩序。