5 分鐘建好 AI 知識庫，token 用量少 95%

你有沒有這種感覺——跟 AI 聊了一小時，隔天開新對話，它什麼都不記得了。

Andrej Karpathy 提出了一個解法：不需要 RAG，不需要 vector database，就只是一個資料夾，讓 Claude Code 幫你自動整理成可查詢的 AI 知識庫。

為什麼 token 用量少 95%

傳統 RAG 的流程是：把所有文件向量化，查詢時搜尋相似度，把相關段落塞進 context 窗口。這個過程本身就需要大量運算和 tokens。

LLM Wiki 的方式完全不同：你讓 AI 事先把知識整理成結構化的 markdown 檔案，查詢時只讀相關的幾個文件。context 窗口裡放的是已經整理好的摘要，不是原始文件。少了向量搜尋、少了大量原始文字，token 用量自然下降了 95%。

LLM Wiki 的結構很簡單，四個層次：

這個設計的邏輯很清楚：raw 是事實，wiki 是理解，index 是地圖，log 是歷史。

「LLM Wiki Prompt」不是一個 prompt，是一份給 AI 的工作說明書。它定義了 AI 處理知識庫的三個操作：

Ingest 是這個系統的核心。每次 ingest 一份新資料，知識庫就長大一張網——新頁面和舊頁面之間建立連結，整個知識庫越來越立體。

這兩個不是競爭關係，是不同問題的不同解法。

如果你的問題是「AI 不記得我的背景知識」，用 LLM Wiki。
如果你的問題是「我有幾千份文件需要語意搜尋」，用 RAG。

LLM Wiki 適合中等規模、結構清楚的知識——幾十到幾百份來源。超過這個規模，或者需要精確的語意匹配，RAG 才是對的工具。

建好 LLM Wiki 之後，在你的專案 CLAUDE.md 裡加一條規則：告訴 Claude Code 在哪裡找知識庫、什麼時候要去查。這樣每次開新對話，AI 都知道它有這個知識庫可以用，不需要你每次重新解釋背景。

一個主題建一個獨立 vault，不要把所有知識混在一起。主題清楚，index 才有意義，AI 找起來才準確。

完整的設定流程和實際操作示範，都在上面的影片裡。